2018-10-24 21:28
扫码打开虎嗅APP
能了解你的状态、兴趣的社交网络关键词图谱,是如何生成的?舆情分析又是什么?看完这个视频,你对人工智能的了解就能轻松超过全世界 99% 的人类!
图文版本送给不方便打开视频的朋友 (●°u°●)」
风靡一时的微博关键词图谱,是如何生成的?
通过抓取用户发送过的微博内容,进行分词,再去除的、也、了等不携带主题信息的高频停止词后,统计其他词语的出现频率,就能得到每个人的微博关键词图谱。通过图谱,用户可以迅速了解自己的状态、兴趣,与他人的关键词相似程度等等。
由于文章通常会有多个主题,这种处理方法也常常被用来对文本的主题进行判断。与机器相比,人类岂不是更擅长这件事?互联网上的文本浩如烟海,这种方法能迅速分析文章的主题并为它们打上标签,可以用来推荐给可能会感兴趣的用户。
同理,通过分析用户的微博、电商评论等内容,商家能够了解商品情况和用户感受。或者干脆为用户打上标签,分析他们的购买意愿,实现个性化营销。
除了内容推荐和精准营销,这种方法也常常被用来分析人们对热点事件的看法,以及事件的过程变化。结合上一期我们提到的情感分析,还可以了解人们对事件的倾向性。
这些场景,其实都属于舆情分析(Public Opinion Analysis)。根据特定问题的需要,NLP 技术能够帮助生成对舆情的整理和深层理解,为人们的决策提供帮助。
视频及图文来自微信公众号:KnowingAI知智(Knowing_AI),作者:虞喵喵。