科学研究

Scientific Research

人工智能AI真的来了

发布时间:2016-12-15

9月28日,在业内举足轻重的科技巨擘Google、Facebook、IBM、亚马逊和微软共同宣布成立一家非营利机构——AI合作组织(Partnership on Artificial Intelligence to Benefit People and Society),首次在人工智能领域建立合作关系。


 IWQ~JAYL%[JDMIV7~0QGAWX.png



  几天前的Google硬件发布会上,CEO劈柴花大量时间介绍了Google Assistant(谷歌面向消费者的人工智能虚拟助手,其核心能力包括:知识图谱、自然语言处理、翻译、语音识别、图像识别)的进步和价值。Google已将这一服务植入到了Google手机Pixel和Google Home以及更多的应用领域当中,甚至包括智能穿戴以及智能汽车。透露出Google领跑人工智能时代的野心。


 T3Y{$PV{_4X_CQTD$KPQ235.png



  科技巨头的野心预示着AI发展将进入更广更深的领域,产生更大的影响,使工业生产、金融、律师、管理顾问、记者等众多行业从业人员都面临被AI替代的失业风险。英国BBC电视台甚至预测,将近一半的普通职业从业者面临着50%被人工智能取代的危险。AI对新闻媒体行业从业者也将会带来前所未有的强烈冲击。


 blob.png



  比如Google最新开发出的“神经机器翻译”(Neural machine translation),已经非常接近人类的翻译。话说,新闻翻译的活儿是不是就可以直接交给机器来干了?


  随着人工智能程序AlphaGo完胜九段棋手李世石,自动化新闻写作机器人的成功开发,不久的将来,新闻媒体记者是不是就要被替代呢?


 blob.png



  什么是AI?


  在探讨AI带给媒体行业的影响前,我们先要了解AI的正确含义。


  AI是人工智能(Artificial Intelligence)的英文缩写,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。


  CrowdFlower众包数据处理公司的CEO Robin Bordoli在《关于人工智能的七大常见误解》一文中提出了人工智能的有3个互相连锁的关键概念:


1.训练数据(TrainingData,TD)训练数据是机器可以用来学习的起始数据来源集。训练数据有输入值和带有答案的输出值,这样机器学习模型可以从答案中寻找模式。比如,输入可以是客服单,带有客户和公司的客服代表之间的电子邮件。输出可以是基于公司某个分类定义的从1到5的分类标签。


  2.机器学习(MachineLearning,ML)机器学习是软件从训练数据中学习到某种模式,并把它应用到新的输入数据中。比如,一个新的客服单,带有某位客户和某位公司客服代表的邮件来了,机器学习模型可以预测出一个分类,并告诉你它对该分类的把握有多大。机器学习的关键特征是,它不是通过固定的规则来学习。因此,当它消化新的数据后会调整其规则。


  3.人机回圈(Human-in-the-Loop,HITL)人机回圈是人工智能的第三个核心部分。我们不能指望机器学习万无一失。一个好的机器学习模型大约只有70%的准确性。因此你需要一个人机回圈流程,当模型的可信度低时,还可以依靠人。


  于是我们可以得到AI的基本公式:AI = TD + ML + HITL


 blob.png


  由此我们可以总结出有关AI的3个关键信息:


1.人工智能不是一开始就具有高超智能的,而是需要一个数据样本集对其进行训练。


  2.机器获得智能本质上是从大量的样本数据中学会了一种模式,并随样本数据的更新不断更新其对模式的认识。


  3.至少在当今,人工智能要做到万无一失还少不了人工把关。


  AI会给新闻业带来怎样的影响?


  了解了AI的含义,让我们来看看AI在新闻领域的应用。


  抓取历史数据并生成图表


  2016年8月30日,路透社与语义技术公司Graphiq宣布合作,旨在让数据可视化变得触手可及。Graphic公司有一个集结了50多位研发人员和数据专家的团队,专门负责收集经济、体育、娱乐等各个领域的数据。路透社借此利用AI实现了迅速抓取历史数据并生成图表,增强了新闻的实效性和可视性。


 blob.png



  撰写新闻


  人工智能写新闻已经不是一件新鲜事了。


  2015年7月,美联社和科技公司Automated Insights合作,采用人工智能技术来报道商业领域的企业财报新闻。从300份一季度到3000份一季度,这次合作帮助美联社大大地提高了财报数量,据顾客反映正确率也大大提高。


  2015年9月10日,腾讯网财经频道发出题为《8月CPI同比上涨2.0% 创12个月新高》的第一篇由自动化新闻写作机器人完成的稿件,引起新闻界关注。


  在今年的里约奥运会上,今日头条实验室自助研发的AI机器人张小明通过两种文本生成技术产出新闻:一是针对数据库中表格数据和知识库生成自然语言的比赛结果报道,即简讯;二是利用体育比赛文字直播精炼合成比赛过程的总结报道,即资讯。奥运会期间通过对接奥组委的数据库信息,实时撰写新闻稿件,在6天共生成超200篇简讯和资讯。


 blob.png



  机器人会取代媒体人么?


  即使是随着技术的进步,人机回圈的必要性越来越小,AI是否就可以取代新闻媒体记者,写出比人类更好的新闻报道呢?


  也许你会说是的,毕竟阿尔法狗就战胜了人类。


  但是围棋比赛和做新闻有本质区别。


  记者的不断创新才是AI创作的源泉


  围棋与创作最大的区别在于围棋有胜负,并且只有围棋本身的规律,不随时代而改变。在阿尔法狗的训练过程中,是先让其学习无数的人类下棋模式后,再让不同版本的阿尔法狗之间进行比赛,并对新的比赛过程进行学习,使其不断超越机器自身,最终才得以超越人类。


  而创作领域没有输赢之分,好坏也是很主观的事情,所以没有办法让其自身不同版本之间进行竞争,也就很难想到方法让其只靠学习以前的文章就能持续提高水平,写出比人类记者更优秀的文章。


  要写出好文章,就要输入大量优秀的的样本,而这些优秀的样本创造需要无数记者充分发挥创造力,如果没有无数记者的不断创新,只有机器人在现有的文章中不断学习,很难想象怎么能与时俱进地写出越来越好的文章以及新闻报道。


  也许随着技术进步AI能写出比大多数普通记者都好的文章,这就对记者提出了更高的要求,但AI最终无法超越不断创新的广大记者群体。


  AI的前进方向由媒体人决定


  另外,更重要的是,在为AI机器人训练时,给它们怎样的样本取决于人类对这一工作本质的认识。


  Oscar Schwartz讲师在演讲中提到,人工智能的发展是一面镜子,AI机器人并非会创作,它们只会通过学习来做的无限像人的某一个方面。而我们则需要决定“要让人工智能像人类的哪一个方面”。


  这一决定需要我们对人本身,对新闻和媒介本身有更深的理解。


  例如,如果要利用AI为用户个性化筛选新闻,我们首先要想明白作为一个用户最需要怎样的新闻,如何避免仅靠用户的浏览记录来推送文章时可能引发的信息娱乐化和狭窄化。


  如果想要利用AI写出好的新闻深度报道,我们需要想明白究竟什么堪称优秀的新闻报道,需要从我们自己平时写深度报道时如何收集材料,如何归纳分析,如何创新中总结出一种规律。


  如果写分析预测,我们则需要知道需要考虑到哪些因素,收集哪些数据来进行分析预测。


  需要与用户进行互动,建立关系时,我们首先要知道用户需要怎样的关系,这个关系随时代怎么改变。


  也就是说,AI说到底是增强人类某一方面能力的辅助,而需要增强哪一方面能力,需要怎么增强,这个最关键的方向性问题需要我们来思考。


  正如ColdFusionTV所说“人工智能研究的原点是人脑,是人类对于自己大脑的理解的反映”,所有的规律和奥秘其实都在我们自身。


  所以对于每一个媒体人来说,只有我们更深入地了解新闻媒体行业的本质和人类通过媒介获得信息、人的思考方式的本质,加深AI领域的人文探索,才能使AI更好的为我们所用。这是AI对所有媒体人全新的挑战。

HCZ]A0B1M237@BEJ4J0V1KK.png



本文源于:搜狐传媒