论文的重复率是怎么算的

论文的重复率是怎么算的

论文的重复率通常是通过以下步骤和公式来计算的:

分词:

将论文内容分解成单词或短语。

比对:

将论文中的每个单词或短语与数据库中的文献进行比对,找出相似的部分。

计算相似度:

使用特定的算法(如余弦相似度、欧几里得距离等)计算论文与数据库中文献的相似度。

计算重复率:

根据计算出的相似度,得出一个相对的数值,即重复率。

论文重复率的计算公式一般为:

```

重复率(%)=(重复部分的字数总和 ÷ 论文总字数)× 100%

```

或者简写为:

```

查重率 = 重复字数 ÷ 总字数 × 100%

```

查重系统会将论文中的相似或重复内容与已有的文献、网络资源进行比对来计算重复率。不同的查重系统可能使用不同的算法和数据库,因此计算出的重复率可能会有所不同。

需要注意的是,查重系统在计算重复率时,可能会设定一些阈值,例如一句话中8个字或以上重复,或者一个段落里存在13个连续字符重复或相似,这些内容可能会被标记出来。

查重结果通常以百分比形式表示,这个百分比越低,说明论文的原创性越高