怎么用NLP提取新闻中的一些关键词?

现在遇到一些应用的问题,就是我如何用NLP的方法提取新闻中的一些关键信息,例如,我只想得到新闻报道的相关公司。 我现在的办法是给jieba分词加自定义字典,字典的建造是通过数据库中所有相关公司的名单建的。 最终目的是接受一个新闻的时候可以找到他是在描述哪个公司的。 有什么好的方法吗?
关注者
21
被浏览
1,444

6 个回答

可以使用NLPIR大数据语义分析平台进行分析。

NLPIR平台能够从大规模数据中自动分析出热点事件,并提供事件话题的关键特征描述。同时适用于长文本和短信、微博等短文本的热点分析。能够用于你进行信息提取。

谢邀。

我假设你问的是工业项目落地时的需求哈。

我接触过媒体、政府、金融、工业等你能叫的上来名的行业领域中的新闻关键词提取的项目需求。

可以给出一个简短的自我体会哈。

提取关键词,不是技术需求,是业务需求。

你要提的关键词不是算法算出来的,而是客户在实际业务场景的强业务需求。

别的不多说了,如果你一定还要用类似TextRank啥的跑结果的话,那你就好好想想baseline怎么怎么选吧~

至于你说在新闻哪发生的,那你先看看一般文章人是怎么判断的,然后再看看机器能不能做一个类似需求呗~