数字资产交易市场处于熊市,但区块链创业热度不减反增,近1年多以来,能与区块链“抢风头”的,非AI莫属,二者相遇,当区块链遇见AI,就像最近华北地区的雨,躲不开绕不过,终究会成为一场话题。
站在区块链的角度看,AI能为区块链带来什么?从AI的视角观察,用区块链能解决AI行业的什么问题?二者融合的逻辑是什么?深究下去,区块链+AI到底是风口还是噱头?
7月17日,本征资本创始团队做客金色财经,为区块链+AI的融合给出了专业的看法。
本征资本三位合伙人:
庞华栋:麻省理工概率论博士,微积分发起人,本征资本创始合伙人
邢大地:普渡大学运筹学博士,普渡大学区块链实验室副主任
耿杰森(Jason Geng):德克萨斯农机大学计算机科学博士,美国南加州大学Marshall商学院客座教授,美国数据应用学院创始人
1问:区块链和AI一个是在封闭数据平台上培育中心化的智能,另一个则是在开放数据环境下促进去中心化的应用。两者融合的逻辑是什么?
邢大地:当前的大多数人工智能算法,无论是statistical learning还是deep learning,都需要大规模的样本数据才能训练出很好的模型。所以人工智能领域的护城河和门槛其实是数据,BAT、FLAG都在想方设法获取和留存用户的数据。如果人工智能代表未来的先进生产力,那么数据就等同于生产资料。而数据的所有权和使用权会通过区块链进行确认,从而带来个人化人工智能的时代。
耿杰森(Jason Geng):首先我们能做的事是在去中心化的数据存储系统上做机器学习,数据属于个体,个体通过分享数据活力;另一个方向是AI算法的去中心化,AI公司或开发者通过区块链网络以一种服务的方式实现其价值。
2问:人工智能研究到目前为止的痛点与需求是什么,能否借助区块链技术来完善?
邢大地:区块链对人工智能最大的作用,就是可以用它来提高了个人数据在人工智能模型中得权重,打造对每一个人真正有用,好用,可靠的人工智能模型。
人工智能目前采用的大多数算法都是在做classification,也就是所谓的分类。比如芝麻分或者美国的FICO分就是对人的个人信用进行评级分类,Amazon或者天猫的推荐系统就是对人的消费习惯和特征进行分类,今日头条就是对个人的阅读兴趣进行分类。但是这种分类是统计意义上的划分,也就是说,他会忽略outlier,也会忽略你的发展和变化。
相信每一个人都有过这样的体验,信用卡公司给了你一个无厘头的理由把你拒绝,淘宝天猫在不停的推送你不需要的东西,今日头条每天给你大量的推送同一个主题的内容,把你包围起来,让你几乎无法获取新的信息。这些就是中心化人工智能体系带来的体验。因为他们简单粗暴的给了你一个标签,把你定位成为某一类的人群,然后不管不顾的按照概率替你做了决定,甚至剥夺了你的决定权。
而好的人工智能,必然是个人化的,将来的人工智能,必然是personalized的AI,基于你个人的最大维度的数据,更为充分的理解每一个个体的需要和行为,从而更好的为个体服务。而区块链恰好提供了个人全维度的数据存储平台和个人化人工智能的计算平台。
Deep Learning的三驾马车之一LeCun教授曾经有一次演讲的时候提到,他认为可解释的人工智能(Explainable AI)才是真正有用的人工智能,而可解释的人工智能,必然是小样本的,个人权重很高的人工智能。这会是人工智能发展的新的阶段,而这个阶段的实现,是无法让区块链缺席的。
庞华栋:人工智能最大的痛点,我觉得是数据的获取。但是这方面,我认为区块链最有可能帮助人工智能用一种比较低成本,分布式的方式获取数据,然后通过激励机制以及好的经济模型来促进人工智能数据的获取和存储。这是我看来最有可能将区块链应用于人工智能领域的一个方法。另一个思路是算力,大家都知道人工智能需要大量的算力,而现在区块链很多挖矿的,因此这个算力可以同时提供给人工智能。
耿杰森:AI算法的盈利化是痛点之一,区块链可以帮助AI开发者把AI算法以服务的方式(AI as service)提供出来,这样既保护AI算法,同时算法以服务的方式提供用户使用。
3问:现阶段区块链与AI相结合的应用中,有没有硬伤?怎么分析一个AI概念的区块链应用是否靠谱?
邢大地:人工智能和区块链的结合,就意味着从体系架构上看,一定是分布式的数据存储和分布式的模型计算。(模型训练是否一定需要分布式,这一点我持保留意见)。所以真正打算落地的AI区块链项目,至少要提出切实可行的分布式存储和计算的体系架构。我们知道其实现有的大数据架构,比如Hadoop,也都是master-slave形式的,如果把单一的master节点变成多个超级节点,并且有一个很好的共识机制,其实距离分布式的数据存储和计算并不遥远。当然,解决了这个问题,还有更多的问题亟待解决,比如个人数据的privacy preserving computing,都是很难啃的硬骨头,需要业内的工程师和研究人员一起来解决。
耿杰森:主要还是看AI和区块链结合的项目是否能解决现实问题,解决实际问题是否利用了区块链的特别属性。AI的问题及其解决,主要是分布式计算解决了算力问题,大数据技术解决了training data和标签的问题,第三是再加上深度学习算法的改进;下一个问题就是数据质量,区块链可以在这方面延伸。
4问:区块链落地慢是业内共识,为什么这么多区块链项目热衷于嫁接AI,这会不会让落地难上加难?哪一类的AI区块链项目更容易被市场认可?
邢大地:没有人工智能的区块链应用场景有限,换句话说,如果大家相信区块链会是下一代互联网的基础设施,那么很难想象没有人工智能技术的大规模应用。所以这是将来一定会,也是必须要解决的问题。
我觉得未来可以被人使用的区块链AI项目,可能会从金融领域开始。
耿杰森:区块链解决的问题是数据存储和准确,这个仅仅解决了大数据的问题;要想产生商业价值,基于AI的数据分析和机器学习的应用,会帮助项目找到商业价值的机会,这是为什么很多AI加区块链的项目。能解决现实问题,还要看解决实际问题是否利用了区块链的特别属性。
5问:投资人怎么去判断一个项目确实把AI应用到了区块链的提升中,而不是仅仅搭车概念炒作?
庞华栋:关于这个问题,我觉得判断的一个可能的标准——是不是一定需要区块链。这一点非常关键,如果用去中心化的方式能够解决,就不一定需要区块链。
区块链技术能否应用于人工智能领域,我觉得最核心的应该是能不能降低成本,能不能增加效率。
6问:区块链的发展与进步,是否会像当年WinTel一样,需要走系统与芯片结合共同进步的路?当前区块链技术与芯片层面的工作结合进展如何?
邢大地:我个人觉得这是很有可能出现的,将来算力会像通用货币一样,成为这个世界最后的硬通货。现在很多人在研究如何把完成特定功能的计算放到硬件里面来实现。举个例子,比如专门做数据库操作的芯片,大家知道其实交易所的交易速度,其瓶颈并不是match engine的性能,而是数据库增删改查的速度。而如果出现了专业化的,可以进行大规模高并发的专业芯片,那么大多数的交易所都可以达到火币,币安的交易速度,技术上的门槛会被大规模降低。人工智能芯片也是一样,比如完成Xboost算法的专用芯片在金融建模中得大规模使用,tensorflow框架的专业芯片在语音识别过程中得大规模应用,都是可以期待的。
算法芯片化另一个重要的价值在于,开源时代,那些很难被保护的技术领先优势,可以依赖芯片化保证一定时间段内的领先。其实苹果最核心的竞争力就是他得芯片设计能力,依靠芯片保护了他最重要的know how, 从而在市场上始终保持十几个月的领先。
7问:人工智能在量化交易和流动性管理领域的应用有哪些?未来是否会出现AI量化公司?甚至AI也发展成为一种数字资产?
庞华栋:其实在过去三四年的时间,华尔街是非常青睐人工智能在量化交易的应用的。据我所知,许多较大的对冲基金为此专门组建团队去从事这个事情,然而百分之七八十的结果并不如人所愿。结果显示,它并不比传统的量化交易模型和量化策略好太多,甚至有时候反而更差一些。但是这不代表说这个事情在将来不会爆发,人工智能自身是一个优势,但也是一个劣势。优势是说它对这个数据里面的逻辑做了一个穷举,然而劣势是我们只知道输入和输出,却不清楚其中的逻辑。
在这样的情况下,它会导致一个量化策略的问题,就是即使挣钱却对挣钱的原因全然不知。当完全依赖于这个黑盒子的时候,其实是很可怕的,因为谁也不能对其可能出现的bug进行预知,而bug一旦出现,金融市场将会面临巨大的风险。
所以,在我看来,AI应用的量化,仍有很长的路要走。目前更现实的是将AI与传统量化结合起来,这样我们更清楚其中逻辑什么,因为很多可以盈利的策略里面都有一个强逻辑,这个逻辑可以是经济逻辑,金融逻辑或数理逻辑。