《解放日报》叶德磊:自媒体中的信息挖掘

作者:     信息来源:     发布时间: 2013-10-15
字体大小:A A A

 

眼下,微博、博客、BBS和股吧等自媒体中的信息愈益受到人们的重视。其中的信息挖掘和数据挖掘不仅可运用于商业用途,也可运用于学术性研究。

  自媒体中的信息挖掘来源于图书情报学上的文本挖掘,或者说是后者在网络信息时代的衍变和演化。词频统计分析是一种基本的文本挖掘分析方法。这方面研究的一个著名案例是,红学家利用计算机对《红楼梦》中词汇使用的频率进行统计分析,得到的结论是前80回和后40回中使用的许多常用词的频率大体相同,进而判断《红楼梦》120回的作者为曹雪芹一人。它虽是一家之言,却为红学研究提供了一个崭新的视角和一种崭新的手段。

  过去,我们只能通过问卷调查或访谈等形式,获取相关信息和数据。现在,通过对自媒体中的信息和数据的挖掘、统计和分析,无疑更加先进、便捷了。更何况,通过一些网络技术处理手段,还可以在一定程度上去除其中的一些虚假信息。

  譬如,有的学者以游客在多种自媒体上发表的游记为依托,通过对众多游记中呈现的景区或景点次数和出现的频率进行统计分析,发现游客对一定范围内不同景区和景点的偏爱存在共通性现象,也发现了一些景区中有的景点只是陪衬而已。这就为具有旅游偏爱共通性的不同景区的联合营销提供了依据,也为景区的设计优化提供了思考方向。

  近些年,国外这个领域的研究也很活跃。如Bollen等人在2011年通过研究证明了社交网络Twitter在电影票房、选举结果等预测方面具有不容忽视的价值。StephanNitzsch2013年则对股票类专题网络论坛中的股票推荐的可靠性问题进行了实证分析。

  通过网络技术分析工具,我们最近对自媒体中关于差别化红利税的网络舆情的市场影响进行了尝试性研究,发现了一些有趣的现象。20121116日,财政部等发文规定,自今年11日起,对股票红利所得按持股时间长短实行差别化个人所得税政策。持股超过1年的,税负为5%;持股1个月至1年的,税负为10%;持股1个月以内的,税负为20%

  也就是说,个人投资者持股时间越长,税负越低。其目的在于鼓励长期投资,抑制短期炒作。但这一税负政策在出台初期被误读并通过自媒体被放大。

  一些投资者误以为,到股权登记日那天,对于派发现金红利和送红股的股票的持有时间不到一个月,就要交纳20%的红利税。因此,在去年11月至今年4月份,自媒体中对差别化红利税的市场影响的评价多是负面的。

  今年34月份,绝大多数高送转的股票在股权登记日前特别是在股权登记日均出现了较大的下跌。实际上,持股1个月的时间计算与股权登记日无关,而且上市公司用公积金转赠股本是不用交纳红利税的。

  大致在进入5月份后,自媒体中对于差别化红利税的误读明显地被矫正,对它的正面评价明显上升。反映到股市中,5月份开始后,高送转的股票又重新受到投资者的追捧。

  股吧中,一些股票的发帖量与股票走势的转折也似乎存在某种微妙的关联,而且对一些股票的负面评论有时会反向地预示股价将上升,这是否为机构投资者在建仓期的刻意为之呢?诸如此类的信息和数据还值得进一步挖掘和深入研究。

  总之,在网络信息时代和自媒体高度发达的今天,如果对于其中大量有价值的信息和数据不去挖掘、不加重视,那实在是很大的浪费。

  (作者为华东师范大学商学院副院长、教授)

 

    《解放日报》  日期:2013年10月14日  版次:5  作者:叶德磊

    链接:http://newspaper.jfdaily.com/jfrb/html/2013-10/14/content_7393.htm

浏览次数: 234

更多
回到顶部