摘要中的句子之间没有很好的自然衔接。
这是因为这些方法都没有真正的理解文章用自己理解后的语言组织成摘要。
从纯粹技术角度出发,此前的抽取式摘要的主要步骤依然是:
将原文本拆分为句子,在每个句子中过滤掉停用词,并只保留指定词性的单词。
由此得到句子的集合和单词的集合。
在此基础上进一步处理,以无序无向图的思路来搞。
计算每个单词节点的重要性。
根据计算的结果以最重要的若干单词作为关键词。
接着是关键短语提取。
最后是摘要的生成。
这些传统方法通常默认将机器认为重要的句子组合成摘要。
其主要缺点是不能概括全文,没有真正的理解文章用自己理解后的语言组织成摘要。
除以上缺点之外,目前主流的文本摘要方法都有人为特征定制和提取的工作。
而林灰搞得这项技术则完全不是这样(具体慢慢展开吧,感兴趣的可以过段时间刷新下看看这)。
甚至林灰觉得他搞得这项技术甚至有可能是开创了国内多项领域研究的空白。
比如说在汉语言文本摘要情感分析这方面。
除此之外还有很多方面。
总而言之,这样的专利自然是有实力角逐科学技术进步奖二等奖的。
而且林灰这种情况客观来说也符合相应的条例。
按照相应的条例:
“国家科学技术进步奖授予在应用推广先进科学技术成果、完成重大科学技术工程、计划、项目等方面做出突出贡献的下列公民、组织,其中包括:
在实施技术开发项目中,完成重大科学技术创新、科学技术成果转化,创造显着经济效益的;
在实施社会公益项目中,长期从事科学技术基础性工作和社会公益性科学技术事业,经过实践检验,创造显着社会效益的;
在实施国家安全项目中,为推进国防现代化建设、保障国家安全做出重大科学技术贡献的;
在实施重大工程项目中,保障工程达到国际先进水平的(此项仅授予组织)”
像林灰这种情况无疑符合“在技术开发中创造显着经济效益”这一点的。
(ps:规则表述中涉及指的是“在实施技术开发项目中”,而林灰显然没参与项目。
涉及到以后的剧情,不是疏漏)
总而言之,从规则和技术方面林灰都相信他搞得这项技术是能角逐科学技术进步二等奖的。
但林灰心中依然是有疑惑的。
究竟是什么单位提名他获得这项奖项的呢?
虽然林灰搞得技术有角逐科学技术进步奖的实力也符合相应的规定。
但没单位举荐的话根本不可能获得提名。
林灰搜了一下相应的举荐名单,结果意外发现是京大举荐的这项技术。
卧槽,要是京大举荐的。
那这样一个科技进步奖妥妥板上钉钉了啊。</div>
83书屋:(www.83shu.com)