张小明(xiaomingbot)是今日头条实验室研发的人工智能机器人,可以通过两种文本生成技术产出新闻:一是针对数据库中表格数据和知识库生成自然语言的比赛结果报道,即简讯;二是利用体育比赛文字直播精炼合成比赛过程的总结报道,即资讯。
张小明的头条号
小明哥(Xiaomingbot)目前主要做运动主题的赛事报道和相关简讯,例如奥运会乒乓球、网球、羽毛球和女足的比赛报道。
小明哥的名气是来自于里约奥运会。在当初奥运会开赛6天以来,其共生成超200篇简讯和资讯。在奥运会开始后的13天内,共撰写了457篇关于羽毛球、乒乓球、网球的消息简讯和赛事报道。其写作的内容包括了小组赛到决赛的所有赛事,而且发布稿件速度很快,差不多与电视直播同时,让头条读者可以第一时间获得赛事信息,牛吧!看看小明哥的头条首页文章吧。
都是体育赛事相关的资讯
我们的 XiaomingBot 在写稿方面有很大的优势,例如非常快,XiaomingBot 在比赛结束的两秒钟之内就可以从生成到发布到读者读到,从创作到分发到自动推荐整个流程全都是机器来完成的。第二个优势是短长结合,小明哥( XiaomingBot) 既可以生成短内容,也可以形成长报道。
那人工智能写稿机器人 XiaomingBot为什么有这种能力呢?
XiaomingBot的写稿模块是由头条实验室与北京大学计算所联合研发而成,结合最新的自然语言处理、机器学习和视觉图像处理的技术之后,通过语法合成与排序学习生成新闻。这是国内第一款可以报道奥运赛事的人工智能机器人,厉害哦我的亲。
除了上面的特点,小明哥还具有以下特点:
自适应根据比赛选手的排名,赛前预测与实际赛果的差异,比分悬殊程度,可以自动调整生成新闻的语气。
自动配图:通过自动选图技术,小明哥( XiaomingBot) 可以给新闻配图,更加生动形象。
样式多既可以生成长的详细比赛描述总结,也可以生成简明扼要的快讯简报。
在较早的时候,新闻机器人就已被世界上的主流媒体所关注并加以使用。例如,国外有美联社的WordSmith、华盛顿邮报的Heliograf以及纽约时报的blossom等。国内则有新华社的快笔小新、腾讯的dreamwriter、第一财经的DT稿王等。
第一个被应用到奥运报道的机器人是<<华盛顿邮报>>的秘密武器Heliograf。据<<华盛顿邮报>>的介绍,Heliograf主要通过人工智能来快速生成一些简单但有效的信息、比如奥运会的比分、金牌总数、以及其他的以数字为核心的报道,主要依托<<华盛顿邮报>>网站和该报 Twitter 帐号进行信息发布。<<华盛顿邮报>>官方称,机器人记者在奥运会期间将在 Twitter 推送 600 则消息更新。
Heliograf的推文
(1)报道发布速度
Xiaomingbot对接奥组委的数据库信息,实时撰写新闻稿件,能在2秒内生成并发布——跟电视直播几乎同步。在Heliograf的相关报道中,并未任何资料显示其在报道上的相关数据。
(2)承载信息量
汇比对了Xiaomingbot和Heliograf的信息量,发现:
Xiaomingbot的报道基本上包含了超过10个元素:包括比赛时间、比赛名称、体育馆名称、比赛规则、比赛持续时间、运动员姓名、运动员世界排名、比赛大比分、比赛小比分及运动员国际和年龄,并根据新闻人物添加了不同的配图。
Heliograf相比较就有更多自由风了,元素基本包含的是时间、运动员姓名、运动员国籍、比赛名称、比赛结果共5种元素,并且无比分结果,其播报元素稍显匮乏。
(3)可读性
新闻的可读性也是衡量一家媒体专业水平的重要标准之一。这方面Heliograf叙事平实,而张小明责完胜。
(4)播报比赛项目
在播报项目数量上,Xiaomingbot暂时只有乒乓球、羽毛球、网球和女足4项.经统计。而Heliograf则囊括了柔道、跳水、自行车、射击、举重、橄榄球、马术、赛艇、击剑等近10个赛事项目。对比结果Heliograf胜出。
总的来说,Xiaomingbot的科技相当厉害,而Heliograf可视为第一代写稿机器人的代表。Xiaomingbot的面世则意味着机器人写稿技术已经进入到第二代写稿水平。