文本比较

实质性文本内容比较工具

使用说明


1. 本工具是实质性文本内容比较工具。

2. 对于以往的文本比较工具而言,如果你将文本中的两个段落或两个句子的前后顺序或位置对调,则这些文本比较工具会认为这两个文本是不同的。举个例子,如果A文章有两句话,每句都是10个字。B文章有完全相同的两句话,只是两个句子的前后顺序对调,则以往的文本比较工具会认为这两个文本的差异率是50%。但实际上,在这种情况下,这两篇文章之间并没有任何实质性的内容改变。它们是完全相同的内容。

3. 使用本工具就可以识别出两个文本之间实质性内容的相同和差异。

4. 在左右两个文本框中输入你要比较的两份文本。假定左文本框输入的是A文章,右文本框输入的是B文章。点击“开始对比”。完成对比后,你会在结果页面的上半部分的右文本框中看到相对于A文章,B文章所新增或改动的部分。同时,你会在结果页面的下半部分的左文本框中看到相对于B文章,A文章所新增或改动的部分。

5. 有的时候,考虑到有些实质上相同的句子可能在不同的文章中出现时会略有差异(比如可能输错了一个字),你希望过滤掉这些本质上相同的小差异,你只想看看这两篇文章中有哪些真正不同的内容。在这种情况下,你可以设置一个小于100的相似度阈值(比如80),这样就可以将那些本质上相同的小差异过滤掉。

6. 默认的文本比较使用的是100的相似度阈值,在这种情况下,你可以进行比较的两份文本的字数最多可达15000字。若你使用小于100的相似度阈值进行比较,则你可以进行比较的两份文本字数最多可达1000字。

7. 本工具适用于这些场合:确定某份文档的最新版本相对于它的上一个(或更早期)版本到底新增和改动了哪些实质性的内容;确定某篇文章是否有抄袭其他文章;其他需要做文本实质性内容对比的场景。