语言与智能,关于AI的近未来我们能玩些什么?

这个话题很难写,真正的干货是直接发高质量论文和做出让世人为之一惊的demo,文字过多的表述往往流于形式,但尽量写出一点有趣有用的东西,至少是对自己。

为什么做自然语言处理?

物质方面的原因是

2011年做选择的时候,放弃了物理和其他行业,当年选择了互联网并在年底接触人工智能的可能性。互联网毕竟有太多资本运作的因素在里面,偏文艺的互联网创业豆瓣知乎也是要有早期氛围来起步的,所以只能业余做几个APP玩玩。选定了人工智能后,观望一圈,语音和图像已经有大厂做得还很不错了,未来肯定是提供接口和开源的,唯一的机会在于语言,so...

非物质方面的原因是

想找有趣的工作。纯文科理科工科等没有足够的各种基础来支撑,也不一定完全适合我这样兴趣很杂的人,科幻和人工智能刚好适合我,将多种东西融合在一起玩。

现状

学校和大公司资源多,如同在北上广风生水起的人。小公司捉襟见肘,如同在纠结还有多少天要撤离北上广的人。只不过很多小团队还是比较自信,想着总有长尾的机会被抓住。 可现状是小公司的算法还没开发完,大公司就出了新算法和封装良好的工具,顶会上没有小公司的身影。拼的只是将成熟的东西转化为赚钱的产品的能力,探索的乐趣只能自己额外争取。 真的如此不堪? - 也有少数一鸣惊人转眼被收购的小团队。 - 现有的理论不足以解决推理等看似更高明的东西,靠的是感知。也许感知就足够,最近几年就能见分晓 - 从对于语言的理解来看,现在做得还太弱。NMT只是一种简单的场景。 所以,还是能玩的。向产品的转化、新的理论和算法、前景等。我们可以随时转身离开回家,但不是现在

具体在玩什么?

  • 语用。真正玩好的在我看来还没有
  • 语言本身的逐层理解。我有几百G的txt-epub-mobi书、几T的贴吧、几G的字幕、几百万的订阅号文章歌词,全网的数据。还是能玩大半年的
  • 一个整体的语言理解流程工具,适应各类语言理解场景,翻译,句法、语义、语用之间能够互通
  • 刷语言方面的新的state-of-art、顶会论文
  • 语言与视频、游戏、真实世界的互动(还没开始)

近期的目标

  • 今年高考数学机器人拿120分 (●—●)。打败科大讯飞。我来做语义表示和概率应用题
  • 参与CoNLL 2017 Shared Task比赛 (Multilingual Parsing from Raw Text to Universal Dependencies),拿到去加拿大参会的机会
  • 有趣的是 高考和CoNLL比赛 对我来说是做的同一个任务
  • 语义理解工具再升一级
  • 其他的留在6月之后了

好的玩法接下来用产品告诉大家 题图:Kismet robot - SAM OGDEN


对于生活和目标,焦虑是必然的,看到最近知乎朋友圈订阅号讨论这个的极多 离开也是必然的,不要惊慌,离场之前再最后疯狂玩一把 (用了day one排版,效果比上一篇好)

大话说完了,talk is cheap , show me the code , 高考和加拿大还有81天,接下来开始西游了

Comments !

blogroll

social