标注产品
联系我们

地址:北京市通州区世星国际写字楼17层

电话:010-56218858

邮编:101100

当前页面:
    首页» 行业新闻 » 美团数据标注员吐槽:百万数据点被甲方打回,精准度成难题

美团数据标注员吐槽:百万数据点被甲方打回,精准度成难题

我有个朋友在美团做数据标注,每天对着电脑屏幕,把街道、店铺、公交站一个个圈出来。他说这活儿干久了,看什么都像数据——走在路上会下意识想,这家店该标成“餐饮”还是“小吃”,那个路口该标成“十字路口”还是“丁字路口”。这种职业病,在数据标注圈里挺常见。不过最近他跟我吐槽,说他们组接了个大活儿,要给某个地图平台批量标注几百万个数据点。他手底下二十多个人,加班加点干了两个月,结果甲方那边一句“精准度不够”,直接打回来重做。他气得拍桌子:“我们标得眼睛都快瞎了,他们倒好,坐在办公室里挑毛病。”

美团数据标注员吐槽:百万数据点被甲方打回,精准度成难题

这事儿让我想起去年打车遇到的一个司机。那师傅导航到一条巷子口,屏幕上显示目的地到了,可他死活找不到那家店。他跟我抱怨:“这破地图,上次害我在城里绕了半小时。”我当时没多想,现在才明白,地图上的每一个点,背后都是标注员的手指头点出来的。数据标注这事儿,听着高大上,实际上就是个体力活。你得盯着屏幕,把图片里的一草一木、一砖一瓦都识别出来,然后贴上标签。比如你要标注一个停车场,得把每个车位都圈出来,标上“标准车位”“残疾人车位”“充电车位”。要是漏了一个,或者标错了类型,整个数据集就得重来。

但问题来了,批量标注和精准标注,本质上就是一对矛盾体。你要求速度快,那标注员肯定得简化流程,比如把“小型轿车”和“SUV”都标成“汽车”;你要求精准,那每个点都得反复确认,效率自然上不去。我采访过一个做自动驾驶地图的团队,他们为了标注一个十字路口的红绿灯,拍了上千张不同光线、不同角度的照片,然后让三个标注员独立标注,取交集。光这一个路口,就花了三天时间。你说这效率,要是拿来批量处理几百万个点,估计得干到猴年马月去。

所以很多公司想了个办法,用AI来辅助标注。比如你丢一张卫星图进去,算法自动识别出道路、建筑物、植被,然后标注员只需要检查一下,改改错误就行。听起来挺美,但实际操作起来,AI经常会闹笑话。我见过一个案例,AI把一架停在机场跑道上的飞机,识别成了“大型白色鸟类”。标注员哭笑不得,还得手动改成“飞机”。更离谱的是,有些AI会把阴影识别成建筑物,把水面识别成道路。你想想,要是这种数据直接用到地图上,导航软件把你往河里导,那场面得多尴尬。

不过话说回来,地图数据标注这事儿,确实不是谁都能干好的。我认识一个做了五年的老手,他跟我说,标注地图跟翻译文章一样,得懂上下文。比如你看到一个“XX银行”,不能光标个“银行”,还得看它是不是24小时营业的,有没有ATM机。再比如你标一个“加油站”,得搞清楚它有没有洗车服务、便利店。这些细节,AI根本理解不了。所以很多地图公司虽然用AI辅助,但最后一步还是得靠人工。这就导致了一个尴尬的局面:AI把活儿干了个七七八八,但最后的百分之十,反而最费时费力。

但问题在于,甲方往往只盯着成本看。我有个做数据标注创业的朋友,他说他们接单的时候,甲方经常提出这种要求:“一个数据点,你标得越细越好,但单价不能超过一分钱。”他算了笔账,一个标注员一天最多处理两千个点,按这个单价,一天才挣二十块钱。这还不算加班费、社保、办公场地。他苦笑着跟我说:“这活儿,比送外卖还不赚钱。”所以很多标注公司为了保本,只能走量不走质。标得差不多就行,反正甲方验收的时候,也不可能每个点都查。

这种恶性循环的结果,就是用户遭殃。我去年去一个县城出差,打开手机地图,发现上面标的店铺,一半都关门了。有个标注是“老王牛肉面”,我兴冲冲跑过去,结果发现那儿是个修车铺。旁边一个大爷跟我说:“那家店三年前就搬走了,你们这地图咋还标着呢?”我这才意识到,地图数据不是标完就完事了,还得定期更新。但更新又需要重新标注,重新花钱。很多地图公司为了省成本,干脆不更新。于是用户用着过期的地图,不是找不到路,就是找错地方。

说到这儿,就得聊聊地图数据的“脏活累活”属性了。你看着手机屏幕上那个精致的地图,觉得特别方便,但背后是成千上万标注员一天十几个小时盯着屏幕干出来的。他们不仅要标城市里的高楼大厦,还得标农村的田间小路。我有个朋友专门标西藏的地图,他说那地方很多路连名字都没有,卫星图上只能看到一条土色的痕迹。他得根据地形、植被、附近村庄的位置,判断这是条什么路。有时候为了确认一条小路是不是通的,他得去翻当地人的游记、论坛帖子。这种工作,AI根本干不了。

但尴尬的是,这种“脏活累活”正在被边缘化。很多数据标注公司因为利润太低,纷纷转型去做别的业务。留下来的公司,为了活下去,只能拼命压榨标注员。我采访过一个标注员,她说她们公司要求每天至少标注三千个点,完不成扣工资。她早上八点坐到电脑前,除了上厕所,中间几乎不停。到晚上十点,眼睛都快瞎了,才勉强凑够数。结果第二天甲方反馈,说她的数据错误率太高,要求返工。她气得想辞职,但想想下个月的房租,又忍了。

这种状态,其实反映了一个更本质的问题:我们太急着要“数据”,却忘了“数据”本身不是目的。地图数据的价值,在于它能不能帮人找到路,能不能让人少走弯路。但现在的商业模式,把数据变成了一个可以批量生产的商品。甲方只看数量,不看质量;乙方只管出货,不管效果。受害的是用户,是那些拿着手机在陌生城市里找路的人。

所以我觉得,真正该反思的不是标注员,不是标注公司,而是整个行业。我们是不是该停下来想想,地图数据到底该怎么做?是不是非得追求几百万个点,而不是做好十万个点?是不是非得用AI代替人工,而不是让AI帮人工干得更轻松?这些问题没有标准答案,但至少,我们得先意识到,那些被标注员圈出来的每一个点,背后都是一个人的时间、精力,甚至视力。别让这些付出,变成屏幕上那个让你找不着北的红点。

010-56218858
售前咨询
进度查询
售后服务
微信:itrid7