点击上方“i黑马”,选择“置顶公众号”
黑马智库,创业必读
更多创业内容请访问www.iheima.com
![人工智能背后的“人工”](https://images.weserv.nl/?url=https://hzimgs.oss-cn-hangzhou.aliyuncs.com/uposs/2021_12/25/1640422853AIu1WK.jpg)
作者:刘敏
来源:GQ报道
这里生产你美颜时“一键瘦脸”的尖下颌,你一起学猫叫时的动态胡须,生产张学友演唱会被实时识别的犯人,生产未来的自动驾驶,智能门禁……
这里是中国特色的数据车间,他们遍布在河南、山东、河北等地的四五线小城里,日以继夜地为世界领先的AI产品服务。
越来越多的人正在加入他们的行列,成为为人工智能打工的人。
![人工智能背后的“人工”](https://images.weserv.nl/?url=https://hzimgs.oss-cn-hangzhou.aliyuncs.com/uposs/2021_12/25/16404228534gSBJh.jpg)
“梯子(可以移动的)”
马萌利面前出现一张欧洲户外咖啡馆的照片。她移动鼠标,绿色的画框浮现在照片上,显示备注“椅子”,她迅速在一瓶花束上补了一个绿框,标上“花(放在容器中)”。
下一张,一个日本花卉市场,几排密密麻麻的绿植中,马萌利检查了每一个标出的“花盆”。
下一张,一个美国孩子的卧室,“椅子”“桌子”……她飞速删掉了“梯子”的画框——客户要求是能移动的梯子,这种高低床上已经焊死的梯子就不能算。
下一张、下一张、下一张,不管眼前是什么场景,马萌利手速不变,依次圈出“梯子”“茶几”“地毯”“沙发”。
“梯子”“茶几”“地毯”“沙发”。“梯子”“茶几”“地毯”“沙发”……如此周而复始,不停重复循环。马萌利每天的工作从早晨8点钟开始,坐到工位,打开电脑,输入用户名和密码,移动鼠标开始标记,日复一日,每天持续9个小时。
屏幕上的图片很模糊,这些都是从全球社交网络上抓取的,角度混乱,像素也不高。那张韩国泡菜摊的照片,很明显来自一个角落里的摄像头。马萌利放大图片,在路人的脚边,圈出一个糊成一团的轮廓:“垃圾桶”。
旁边工位有人打开了音箱,活泼的流行歌响了起来:“燃烧我的卡路里!”
房间里有几百个屏幕,闪动着颜色不一的图片,每个人都在框选同样的内容:垃圾桶、梯子、茶几、地毯……这是河南省平顶山市郏县,一家叫千机数据的公司,房间看起来像一个网吧,在网络神曲伴奏下,年轻的员工们窝在柔软的沙发里,不停地拉框。马萌利是最后的审核员,她和同事要检查所有人拉的框,以保证每个画框都严丝合缝地贴着目标的边缘,图片里所有目标都要被框出来,不能有任何遗漏。
马萌利每天要检查至少1000张图。手头这个单子已经干了两个月,同事们标注了上万个垃圾桶、梯子、茶几、地毯……29岁的马萌利知道,这些标好框的图片汇总后,将发回北京一家AI独角兽公司,变成人工智能的学习材料。
她不知道的是,这几万个“梯子(可以移动的)”标注,展示了梯子的无数个样子,再经过深度学习算法加工,最终让计算机认识,这就是梯子,可以移动的那种。
她日复一日标注的数据来自百度、京东、阿里、旷视、Momenta等大公司,全部应用于人工智能训练。一种行业说法是,任何人类能在5岁之后做的事,对机器人来说都很简单,但是5岁之前,人类用本能就能理解的实际信息,计算机要用最笨的办法学习。这时候,就需要数以万计的马萌利们为人工智能提供标注服务了。
计算机认识沙发、梯子又有什么用?
马萌利回答不了这个问题,转头去问老板刘洋锋。刘洋锋今年31岁,是他去北京竞标抢到的这批活儿。他搔了搔头发,想起甲方提过一次,9月8号他们要去国外参加一场世界级人工智能比赛。“这些是给那场比赛用的?”他不太确定。再往下说,他也不懂了。
![人工智能背后的“人工”](https://images.weserv.nl/?url=https://hzimgs.oss-cn-hangzhou.aliyuncs.com/uposs/2021_12/25/164042285369JXVw.jpg)
为AI服务
我来郏县的第一顿饭,刘洋锋和合伙人刘磊带我去吃了本地一家网红饸饹面,面馆有位漂亮的女主播,靠拍餐厅各种日常,在一家短视频平台上有88万粉丝。中午,餐厅两层楼坐得满满当当,一半是食客,一半是慕名而来的粉丝。