TOP榜写作榜手机小说

最近更新新书入库全部小说

总裁文学 >> 穿越:2014 >> 第339章 另类的学术风格

第339章 另类的学术风格 2/2

内容表示→权重计算→内容选择→内容组织。

内容表示是将原始文本划分为文本单元的过程,主要是分字、词、句等预处理工作;

内容表示的主要目的是通过预处理将原始文本处理成算法容易进行分析的形式。

权重计算则是要对文本单元(即预处理后原始文本)计算相应的权重评分,权重的计算方式多样,如基于特征评分、序列标注、分类模型等提取内容特征计算权重。

这个步骤的目的是通过这一系列计算完成对预处理后的原始文本实现初步分析。

内容选择是对经过计算权重后的文本单元(即经过步骤2权重分析过的文本)选择相应的文本单元子集组成摘要候选集,可根据要求的摘要长度、线性规划、次模函数、启发式算法等选择文本单元;

内容组织是指对候选集的内容进行整理形成最终摘要,可根据字数要求按顺序输出,也有研究者提出使用基于语义信息、模板和神经网路学习的方法来产生符合要求的摘要。

从技术框架的这几个层次的对应描述来看,可以看出无论是权重计算还是内容选择抑或是内容组织此三者都是很重要的。

如果搞不定权重计算和内容选择的话则根本搞不清楚摘要的时候具体对文本哪些地方进行摘要。

如果搞不定内容组织的话更是直观影响用户体验。

在这种情况下,这个时空的人们在进行自动文本摘要方面的研究时也确实是比较重视自动文本摘要的权重计算、内容选择和内容组织这三个方面。

喜欢穿越:2014请大家收藏:(www.zcwx8.com)穿越:2014总裁文学更新速度全网最快。

穿越:2014最新章节 - 穿越:2014全文阅读 - 穿越:2014txt下载 - 猪熊的全部小说 - 穿越:2014 总裁文学

猜你喜欢: 善终秋以为期乘鸾刺青黑莲花的幸福生活我、我是你的姐姐领进门:掌权典型意外(ABO)十年对手,一朝占有如意小郎君