这一个多月以来,国外高校的教授和学生在ai这件事上不停地斗智斗勇。
但是根据我们这个月收到的ai指控的学术不端的case比例来看,这场博弈目前是教授们占了上风。
近来国外的大学都在严查ai,澳洲尤其严格,根据我们机构目前统计的案例比例,澳洲八大占了的case占了85%,原因是因为Turnitin目前检查ai的准确率已经上升到了98%并且成为了澳洲大学教授们判定论文的重要依据(这是TT给出的数据比例),但是在我们看来这个数据的准确度有待考量,因为TT的ai检查机制把大部分的翻译软件编写的内容也算了进去(真的)。ㅤ
根据我们在Turnitin的网站浏览的资料来看,TT检查ai的底层逻辑是通过大量的从功能性ai收集来的ai编写的论文数据,更新了数据库,从而开放ai的检查功能。
这个检查机制判定ai的依据是:
Include lists without a lot of structural variation, text that literally repeats itself, or text that has been paraphrased without developing new ideas.
1、没有很多结构变化的列表、字面上重复的文本。
2、在没有产生新想法的情况下被释义的文本。
这意味着如果学生们在写论文的时候大量的重复文本/单词,结构呆板,语句衔接没处理好,都有可能会被判定ai?因此,大部分翻译软件直接翻译出来的原文都会因此被判定ai,常见的如Deepl和Google等。
TT判定ai的百分比又是怎么出来的呢?
TT原文(如上图):the prediction will be mostly "all or nothing" because we're predicting on a single segment without the opportunity to overlap……
大概意思是,TT检查ai是一句一句输出判定的,他的判定结果只有0和1,就是否或者是,之后根据判定出来的百分比来给出百分比判定,且学生自己写的和ai混合的语句很可能会被判定为AI。