我已授权

注册

李勇:大数据挖掘意义在提高胜算

2013-12-25 14:39:14 和讯股票  白金坤

中国人民大学金融系主任李勇
中国人民大学金融系主任李勇

  和讯网消息 中国人民大学金融系主任李勇在接受和讯网《中国宽客》专访时表示,以往在调查市场心理和情绪变化时必须做实验调查,这种调查既不可靠,成本又比较高,但是有大数据之后,可以将网页中背后ID的情绪给挖掘出来,指导交易。大数据挖掘的原理是根据人类的行为都有惯性和习惯,通过对于习惯的挖掘仅仅是代表一种高概率的推测,但并不是一定100%完全和结果相符,他的优势是可以提高投资决策的胜算。

  以下为访谈实录:

  和讯网:另外,我听到这样一个案例,比如说一些投资者根据伯南克,就是美联储主席的一些讲话,分析出什么时候可以有优惠推出,是否会推出,然后作出投资决策的判断。我想知道,这种案例是否真实存在呢?

  李勇:因为这种事情呢,在各个行业大量存在,因为这个也很容易理解。因为任何事情,都有其规律性。比如我举个很简单的例子,当然这个例子不一定和金融相关。比如说以前我们在SARS的时候,大家都知道,因为医院是一个是后的判断,大致收了多少病人之后,有多少病人出现这个症状之后,你才能知道这个地区,有多少SARS病人,大概多少情况,但是这个时候已经来不及了。但是你想,一般情况下,我们从预测角度说的话,一般情况下,你去医院,实际上是事后,为什么这么说呢?你肯定是首先感到身体不舒服,某个地方的症状,在网络比较发达的情况下你可以查,发现自己的症状可能会与这个症状相关的时候,你才能去医院。这个时候,google当时做了一个很好的预测,非常准。很简单,他准确预测出了,哪个地区可能大规模地有SARS爆发的可能性。因为道理很简单,因为从这个地区,很多人用google,百度去查。所以搜索的记录他是有的。

  一旦某个地区有很多人去搜索同一种病的症状的时候,也预示着这个地方可能爆发SARS疾病的可能性很高了。你刚刚说了伯南克的事情,我们讲量化宽松的退出,一直在讨论这个问题。但是你想,任何一个东西的决策,都依赖于很多其他的东西。比如经济增长的指标,经济增长的指标也可以分很多细的指标,比如CPI,比如GDP的增长,比如房地产市场的情况等等。这些东西,我们是之前知道数据的。这些数据的好坏,直接决定着QE是不是要退出。

  你想,如果我对历史数据本身也是很清楚,对经济增长的一些情况和一些指标历史数据都知道,如果伯南克在他演讲中,我就挖掘,他重点提到哪几个指标。这个也许就是他做决策的一个很重要的依据,我把他的决策,这这些指标数据找到,然后根据他的讲话,作出一个判断,我觉得预测成功的可能性还是很高的。这个时候大数据的优势就会体现出来了。所以,并不是说不可能的,因为大数据很重要的是预测。从这点上讲,我觉得这种情况发生也是很正常的。就跟我刚才讲的SARS的情况很类似。大数据改变人的生活方式也好,还是行业变革也好。因为万物之间都是有规律可循的。

  和讯网:其实,我想到前几年,我看到一个案例,就是讲到,每个人写文章的时候,其实有自己的语言风格。然后通过一些数据来挖掘,就这篇文章是否是由这个作者真实写的。比如像《红楼梦》,有一些数据分析人员认为,后几章。

  李勇:36回是不是曹雪芹写的。

  和讯网:对,当时我觉得这个挺有意思的。其实我觉得,这样的话,其实后来没有得到更广泛的应用。我们在后来发现,比如文学打假过程中,当然也有一些网友拿这些数据来质疑。但是我从觉得,可能这些手段并没有得到大部分网友的支持,仅仅是一种论证的手段,其实就是具有孤证的感觉一样。我想知道大数据在数据挖掘过程中,有没有局限性呢?

  李勇:你说的很对,刚才你谈到《红楼梦》的问题,包括后来的韩寒的问题。因为《红楼梦》的问题,很多人都在研究,包括我的导师,退休之后也在研究这个问题。因为这个东西呢,我个人觉得,你首先一定有一个前提,就是人之间是一定有规律性的,人的风格要保持不变的。因为人一辈子涉及到自己的家庭成长,教育,各方面经历,你会发现,任何一个人都讨不脱规律可循。就是你写作的风格,你说话的风格,比如我们最典型的口音,都会有一定的规律可循。我觉得这样做,也是有一定的科学道理的。因为现在红学的研究也是一个比较热门的方向,很多人都在研究。你说的局限性嘛,你说的很对。

  我想任何一种工具都有局限性。我觉得从量化角度说的话,包括从概率角度说,我们回到一个概率的概念。我们讲只要未来的事情不发生,你永远不知道事实。你现在所做的一切的努力,都是对未来的一个预测。既然是预测的话,不可能是一定准确,或者一定不准确,我们一般不是从这个角度考虑,而是我们说从概率的角度,从不确定性的角度去考虑。因为在未来有很多的不确定性,我们所做的一切努力,包括大数据也好,尽可能是提高预测的准确性。

  比如说本来我只有三成的把握,但是通过大数据,我可能提高到九成了,我认为这是一个进步。大家可以想像,我们可以问问自己。我们从小学读书,我们努力奋斗也好,为什么要努力,没有人告诉我们努力一定成功,没有人告诉我现在所有的付出,我将来一定带来回报。那我们为什么还要去努力?因为这个所带来一个重要的心理上的概念,大家都知道,努力是提高了成功的概率。就像我们为什么要考人大的研究生,考北大研究生。

  我们经常说,考人大有七成把握,考北大有九成。有的时候觉得很奇怪,这个概率怎么来的?为什么有九成,为什么有七成呢,还是对历史的判断。看人大历年的招生情况和北大的录取情况,你可以有一个判断,这实际上就是一个数据分析,实际上你不自觉地做了一个数据分析。但是可能你体会不到是数据分析起了作用。比如你决定考人大之前,考北大之前,你肯定查今年高考分数线。根据我当年高考的时候,模拟考试的分数,我大致知道我的成绩,可能会考上北大的,或者是清华的可能性大致是多少。

  所以,任何一个事物,只要我们肯努力,数据量的增多,信息量的增多,技术进步之后,我们可以提高成功的概率,这一点,从哲学的思维上讲,也可以解释,我们为什么要去努力?去开发新技术,去开发各种各样的方法去分析数据这个道理。你可以这么说,既有它的局限性,也要发挥主观能动性,就体现在这个地方。

  和讯网:刚才听你这么说,其实我觉得大数据可能量化投资,很多的精髓是一脉相承的。比如他们都是为了提升成功率,但是不能保证结果百分之百准确。

  李勇:你说的这点非常对。

 
(责任编辑:李坚 )
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门新闻排行榜

和讯热销金融证券产品

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。