APP推广合作
联系“鸟哥笔记小乔”
AI 会让谁失业?
2019-06-26 19:10:00

最近在读《AI极简经济学》,除了翻译得读着很痛苦,确实是本好书。国内的翻译作品给译者的报酬实在是太低了,也难保出现大量的谷歌翻译式的作品。


这本书核心解释了一件事情:人工智能的预测,与经济学之间的关系。因为当人工智能的预测效果与成本都足够可控,那很快就会进入寻常百姓家、渗透进我们的衣食住行。


读的过程中我在即刻发了一个消息:



不少朋友留言表示比较疑惑,到底什么算替代品、什么算互补品?到底哪些会被取代?哪些比较安全?确实怪我直接引用了本就翻译略差的原文。


我过去也跟AI算是有一些接触。我读研的实验室是哈工大信息检索实验室(已改名哈工大社会计算与信息检索研究中心),做过一些机器翻译和机器学习的项目,身边的同学毕业也大都去做算法研究或算法工程了。


所以今天就基于这个问题,结合我过去的经验,跟你分享下我的想法。



1 常见的 AI 都是如何运转的


现阶段大部分优异的人工智能,都是绝佳的模仿者,而非思考者。从 AlphaGo,到 AlphaStar,都是学习了无数人类的操作才变得这么厉害的,而人类为什么要如此操作,它们全然不知。


(AlphaStar被质疑赢过职业选手全靠手速。)


要解释 AI 的运转逻辑,机器翻译就是很典型的课题。


早在计算机出现之前,就有苏联科学家提出了基础的构想,在 ENIAC 之后,IBM 为首的企业也参与进机器翻译的研究中。不少学者都期待,能够出现一个像科幻片里那种实时翻译器一样的工具,全球各族人民肯定能够更加团结,这必然是划时代的发明。


翻译这件事,乍一看好像没有太难。一个事物,在绝大多数语言中,都有对应的词汇,“妈妈”对应“mother”,“桌子”对应“desk”,可以建立对应关系;语言学也有了成熟的体系,语言的语法规则特点做拆解后,变成有效的算法策略,岂不应该是水到渠成的吗。


可是事与愿违,机器翻译却直到20年前才算有长足的进步。为什么呢?


因为基于规则的机器翻译太难了,同一个词语,在不同的情景下,含义全然不同。


比如:



大量的俚语和用词习惯都是在人类实际使用语言的过程中毫无规律地出现的,用规则方式解读,几乎没有可能。


无数语言学家和计算机科学家探索了几十年,都没有做出一个哪怕看起来勉强可用的翻译器。


而在规则机器翻译流派之外,49年就有科学家提出了统计机器翻译的理念,认为是否可以用“猜”的方式去做翻译。也就是说,机器不关心“意思”到底是什么含义,而是看“不好意思”和“是我不好意思”同时出现的时候,大概率会对应哪个英文短语。


可以想象机器是一个学舌的鹦鹉,左边站着一个中国人,右边站着一个美国人,他们每次说同样含义的话。鹦鹉就会疯狂学习和记忆他们的说话内容,等到再有第三个人来跟它讲话,它就把记忆中最高频的同时出现的句子或者短语讲出来就好了。


这个方法在早期没有特别受重视,因为效果跟规则机器翻译比也好不到哪去。机器翻译的发展,一直在基于规则的路上,每年提升零点几个点的速度前进。


2005年,机器翻译突然有匹黑马出现。NIST 的年度机器翻译评测里,Google 一跃成为冠军,而且比第二名要超出5%,引起了轰动。


(图源:吴军老师的《数学之美》)


这是划时代的一幕。究其原因,说来也简单,Google 有两个武器:做搜索引擎积累下的海量语言数据库,以及互联网大公司才有的分布式计算能力。前者让统计机器翻译的数据更全面,后者让模型可以变得非常庞大复杂。


此后,机器翻译就走上了统计之路。在 2016 年, Google 发布了基于神经网络的更强大的翻译系统,始终是机器翻译的领军角色。直到现在,各位手里用到的机器翻译工具,也全部都是基于统计原理设计的。


想必说到这里,绝大多数 AI 的原理也就容易理解了。它们全都是出色的鹦鹉,在模仿学习人处理事物的行为,做出准确的复现或者预测。



2 现在的 AI 做不好什么


绝大多数 AI 都是基于统计的,训练出一个“出色的鹦鹉”,是要靠反复的、海量的输入。AlphaGo 要输入无数的棋谱,AlphaStar 要输入无数的游戏录像。


当然,现在的机器学习尤其深度学习,已经能够让鹦鹉变得略聪明一些,不只是学舌,还知道总结部分方法和规律,来验证新的内容。像人脸识别系统,就可以对一张全新的脸,做有效的识别模型。但它依然不知道本质的原理,这也是基于统计似乎很难走到的终点。


在这样的背景下,输入的数据是影响 AI 质量最重要的点。最优秀的 AI 大都在互联网公司和政府手里,他们拥有最全面的数据输入;而不是研究规则和理论为主的学界。


这样看,AI 存在的瓶颈有这样几种。


首先,输入不足的事物 AI 就很难预测。


有的事情属于迭代太慢。


像美国总统大选,每 4 年才举行一次,每次的影响因素又太多,拿到的“训练集”实在太少,就根本无法预测。


还有的事情是输入几乎不可能完备,或者以现今技术根本做不到。


像“女朋友生气了到底是为什么”就是输入几乎不可能完备的预测。因为人的心理变化涉及的因素太多,有可能就是女朋友看到朋友圈你为别人点了个赞,又联想到了上次你没有给她买生日礼物,再想到你给前任买的礼物特别贵… … 衍生出一系列的结果,你压根都无从推理。在这种缺乏输入的判断上,人和机器一样无能。


其次,AI 只能学会教给它的东西,不会学习新的,除非你再教给它。


比如,之前特斯拉的无人驾驶系统出了误判,就是把卡车上的蓝白色车身当做了蓝天白云。人工智能没有结合周边更多显而易见的场景来推测这是个卡车——因为系统里没有这些输入。总之,看到车身颜色就按照统计概率看认为是蓝天白云,才做出了误判。


再比如,哪怕是再强大的机器翻译器,在遇到新词汇和压根没有在网上出现的词汇时就完全无能为力。“坑爹”这样曾经的网络热词,假如没有一个网友曾经准确在网上翻译给外国友人过,那这个词翻译器就永远不会翻译,它没有能力根据上下文去猜测。


最后,没有评测体系的预测, AI 也无法胜任。


机器学习的 AI 都要有一个对量化标准的追求,以建立预测结果跟标准之间的关系来训练模型。


比如,当我们输入一堆音乐,来让 AI 学习后,AI 谱出的曲子一定是参差不齐的。要么我们就在输入好的音乐后,还要输入坏的音乐,并且告诉 AI 好和坏的程度;要么我们就在 AI 谱出曲子之后,反复给它的曲子打分。AlphaGo 就是在 AI 互相对战反复确认胜负后,才能快速成长的。


在一些特殊的领域,像涉及到文艺创作的、有价值观差异的许多无法明辨好坏的事物,就很难让 AI 做好预测。比如用 AI 去判定一个人是好人还是坏人,由于不存在评价好坏的绝对标准,那 AI 就无法完成。


目前的 AI ,只能基于“已知”做预测,不能创造未来。都需要已知的数据、已知的结论、已知的课题。从人类借用 AI 的预测做决策,到人类完全信任 AI 直接做决策,还有巨大的鸿沟要跨越。



3 AI 会让给哪些工作更有价值?


《AI极简经济学》里认为,数据、判断和行动是互补品,会变得更重要。


这三者分别是什么呢?我讲下我的理解。


数据,指的不是做数据统计的人,或者做数据分析的人,而是指拥有数据的人/组织和有能力获取数据的人/组织。


比如,基于统计的消费推荐变得愈发重要,那阿里、京东的产品和背后的数据积累就变得重要;基于统计的无人驾驶变得愈发重要,那交通部门、导航软件和网约车平台就变得重要。


有大量做数据工作的人,反而其实是在做 AI 替代品的工作,比如说单纯的导航功能,有角色会根据过往的用户出行数据来做分析和统计,以便找出一些规则。但足够强大的 AI 根本不需要规则,只要输入足够,就能给出好太多的预测,就会把这样的角色替代掉。(实际场景可能复杂得多,需要做判断,仍然需要人的参与。)


判断,指的是要告诉 AI 哪些是对的、哪些是错的。


AI 学习和掌握一个能力,是为了人类服务的,那这个“服务的目的”,是必须人来赋予。这里就需要人来给出判断。


比如,刚刚提到的导航功能,就可以用机器学习做得足够智能,可以算作是 AI 产品。但是这就代表不需要任何产品运营的参与了吗?当然不是,对于这个产品需要达成的目标尤其是约束条件,仍然是人要赋予的。


最短时间当然是第一要素,但在多大程度上用户会为节省时间而愿意付高速费?多大程度上用户会很讨厌堵车或者等红绿灯?等等,这些基于人感受的判断,会影响导航推荐路线的策略。


行动,当然就是基于预测的执行了。拿到了无人驾驶的好算法,该怎样应用?拿到用户消费行为的推荐,该怎样应用?


不过,通常执行的内容本身又会延伸出是否有可能被 AI 替代的问题。


我们以一个更具体的案例来说数据、判断和执行。


我在点我达做调度产品的时候,在搭建了基础的基于全局高效为目标的调度系统后,就发现了一个很实际的问题:骑手经常会遇到取送餐的困难地点,而这个信息通过高德地图或者百度地图是无法获取的。


什么是取送餐的困难地点呢?比如,这个大厦的保安不允许走客梯,那就只能走货梯,非常慢;这个小区不允许电动车驶入,步行送餐非常麻烦;这个商区高峰期人特别多,不管扶梯还是直梯都要等很久。等等。这个因素不考虑进调度的算法决策里,得到的结果就不准确,骑手就会很不满。


这个信息要收集起来,是一件要设法产品化的事情。一方面,可以让线下的运营同学帮忙提交,另一方面,骑手也可以跟客服或在产品上报备。另外,也能从日常骑手配送的行为数据里去挖掘。(数据)


另外,收集上来的地理位置信息,要分门别类,并且与“困难程度”建立联系。需要步行上楼,和需要等电梯上楼,难度还是不一样的。接下来,就要与工程师协作沟通,地理位置信息对调度策略的整体影响了。有困难属性的订单,配送时间可以放宽,放宽的程度也要从产品经理视角判断,过宽会影响效率,过严会影响骑手体验,这个权衡也是要产品经理决策的。在反复测试调参和试验后,才能得到具体的策略。(判断)


最后,当调度算法体系改版好了之后,就要跟骑手宣导和教育新的调度规则,让困难地点的因素影响真正发挥作用。(行动)



4 AI 会让哪些工作更没价值?


单纯的预测,所谓具备完善的数据、有明确目标、基于已有经验而进行的工作,会变得没有价值。


举两个例子。


小王是公司的市场投放人员,工作的主要内容是,尝试投放所有可用的渠道,并且计算 ROI,然后继续提升高 ROI 渠道的投入、减少低 ROI 渠道的投入。


小孙是公司的运营活动人员,负责配置各种活动。活动都是已经成型的几种模板,他会基于每次用户数据的波动,从自己的经验判断应该选择哪种活动,以及在活动中配置怎样的具体规则。


这两种就是很典型的,会快速被替代的工作。如果你正在做这类工作,还望警惕。


而像产品和运营的决策往往都不具备“大量的迭代数据和迭代结果”的条件,尤其是一个决策可能跟一大堆约束条件、影响因素耦合在一块。


在这样的场景下,AI 可能会替代产品经理:要做短视频,可以自动组合出几千甚至上万种产品方案并提供给用户使用,基于用户的使用习惯,来找出最佳的方案,继续自动组合持续迭代。


在具备这样足够灵活的生产和检验条件之前,产品经理还不太可能被替代。


不过看如今互联网产品设计模式的发展,已经在向这样的未来迈进。


一线的互联网公司都在用不止有两个用例的A/B test、用完备的数据埋点统计分析用以找到解决方案,虽然还不够智能,但都在陆续替代产品经理的工作、让产品经理变得逐渐不重要起来。


产品经理很像是基于规则在做产品,而现在逐渐出现了不少决策都是基于统计的。有没有觉得跟机器翻译的历史很像?


想到条件逐步成熟,未来可能会出现一个基于统计的优异产品决策 AI ,就像 2005 年的 Google 杀进机器翻译领域一样,还是颇有些危机感的。




希望能帮到你。 


刘飞
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
刘飞
刘飞
发表文章234
资深产品人,滴滴出行司机方向前产品负责人,点我达前产品专家,嘟嘟美甲联合创始人,锤子科技产品经理。《从点子到产品》《产品思维》作者。
确认要消耗 0羽毛购买
AI 会让谁失业?吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接