问题 什么是一个很好的自然语言库用于释义? [关闭]


我正在寻找一个现有的库来总结或解释内容(我的目标是博客文章) - 对现有自然语言处理库的任何经验?

我对各种语言持开放态度,所以我对能力和准确性更感兴趣。


7776
2017-08-24 20:57


起源



答案:


有一些关于Grok的讨论。现在支持OpenCCG,也将在OpenNLP中重新实现。

你可以找到OpenCCG http://openccg.sourceforge.net/。我还建议使用Curran和Clark CCG解析器: http://svn.ask.it.usyd.edu.au/trac/candc/wiki

基本上,对于释义,你需要做的是写出一些东西,首先解析博客文章的句子,提取这些帖子的语义,然后在词汇空间中搜索,这将构成相同的语义意思,然后选择一个与当前句子不匹配的。这将需要很长时间,可能没有多大意义。不要忘记,为了做到这一点,你将需要近乎完美的回指分辨率和接受话语层次推断的能力。

如果您只是想制作没有机器可识别重复内容的博客文章,您可以随时使用主题和焦点转换以及WordNet同义词。肯定有一些网站已经从AdWords中赚钱,之前已经这样做了。


10
2017-10-10 22:30





我想他想通过自动解释这个系统正在监控的博客来生成博客文章。

如果您可以组合2到10个相似的博客文章,但是来自不同的来源,然后自动进行释义的“真实”摘要(1篇博文的大小),这将非常有趣。

它也可能对Homeworks来说很棒。不幸的是,这并不容易。

我能看到的唯一方法是能够将每个句子分解为“含义”,然后随机改变句子结构和一些保留含义的词。

这些句子意思相同:

  • 我讨厌这个人,他是如此愚蠢。
  • 这家伙很蠢,我讨厌他。
  • 我鄙视这个愚蠢的家伙。
  • 他很笨,我讨厌他。

编写一个程序将这些句子中的一个转换为其他句子是非常重要的,这些是简单的句子,来自博客的真实句子要复杂得多。


5
2017-10-09 14:25





你进入了非常远的AI类型域。我主要使用Attempto Controlled English在文本转换为机器知识方面做了大量的工作(参见: http://attempto.ifi.uzh.ch/site/),它是一种自然语言(英语),完全可以通过计算机处理成几种不同的本体,例如OWLDL。

好像那样我们会过度杀戮......

有没有理由不只是在你的博客文章的前几句话,然后为你的摘要附加一个椭圆?


0
2017-08-24 21:14





谢谢你们的链接。看起来GROK已经死了 - 但它仍然可以用于我的目的。

另外2个链接:

Attempto Controlled English是一个有趣的概念:因为它是一种完全相反的方式来查看问题。对我想做的事情不太实际。

@mmattax至于建议采取几句话 - 我不是要提出一个总结:否则这将是一个很好的 柔道 解。我希望实际总结用于其他评估目的的内容。


0
2017-09-01 04:24





可能想尝试GATE或封闭源,专有和昂贵的TextAnalyst COM API


0
2017-10-09 14:02