公约倡议:对机器翻译与自动化程序的处理

From Team Fortress Wiki
Jump to: navigation, search


This page serves as a propose to establish a feasible long-term regulation on the usage of machine translation and automation program within the Simplified Chinese translators based on consensus, with detailed solutions on how to react to such edits.

背景

本页面的创建旨在于意见集中的基础上为简中页面上机器翻译与自动程序的应用处理提供长期可行的方针指导。

尽管于整个网站内设立一套更为具体可操作的规范是更加理想的,但如今的情况难以保障其制定与执行的效率。

议程

如无特殊情况,以下编辑者请于2023年11月25日0点后2023年11月27日0点前(UTF-8)于本页面就相关问题以投票形式表态——这样的时间安排是为了照顾BEUFK。

统一投票模板:{{c|+}}

尽管本公约的发起人User:Dereko于此页面创建时已事实上脱离非翻译相关的TF2玩家社区两年之久,但至少对于维基简中社区的活跃状况是很了解的——此名单由其根据历史贡献成果与近期活跃状况而得出。

理论上这个表格不可能出现“平票”的情况,所有人投票完毕后即视作票数最多的方案生效于所有简中页面,并将得到moderator的权限支持作为执行保障。

投票

本公约通过后将会长期生效,直到新的形势下需要将其否决,抑或简中主要编辑人员的构成难以支持其有效性为止。因此请在充分考虑与交换意见后审慎表态——为了鼓励各位这样做,一经投票不得撤回

弃权不是可选项。以下是对各投票选项的阐释:

机器翻译

如果这里有个“推广”的选项,我身为moderator就该下课了。

  • 质量(结果论者):机器翻译只是可以指控的质量问题之一,应着眼页面的整体质量进行评判,而是否属于机翻也仅就结果而言。
  • 杜绝:任何有机翻嫌疑的页面都应得到处理,无论页面本身是好是坏。
自动程序
  • 推广:应让自动程序创建的框架在将来将要翻译的更多页面中得到推广——如果有那个能力的话。
  • 容忍:自动程序的应用对于部分格式化的页面而言利大于弊。
  • 非机翻原则:自动程序可以应用,但不得直接在页面上提供任何未经处理的机翻内容——这意味着自动批量创建的页面会显得更“白”。
  • 杜绝:我不支持运用任何形式的自动程序。
简繁转换
  • 容忍:维基百科上许多页面的情况完全可以出现在本维基。
  • 杜绝:即使质量如何优秀,也不该直接简繁转化。
处理方案
  • 零容忍原则:只要发现问题页面即可直接申请删除,任何重新翻译都要从头进行。
  • 先礼后兵:在对编辑者做出基本的提醒过后若无改良意向,则直接申请删除问题页面。
  • 自由裁量:将申请删除/重新翻译的裁量权交给其它编辑者,根据页面整体状况来决定——即保持现状。
用户
(A—Z)
机器翻译 自动程序 简繁转换 处理方案 其它意见
质量 杜绝 推广 容忍 非机翻原则 杜绝 容忍 杜绝 零容忍原则 先礼后兵 自由裁量
User:AlexT Pictogram plus.png + Pictogram question.png ? Pictogram question.png ? Pictogram plus.png + Pictogram question.png ? Pictogram question.png ?
  • 周末才有时间和心情来仔细阅读这个页面,实在是很抱歉。这些投票的选项却又模棱两可,叫人很难选择。为何不采用开放式的讨论呢?
  • 对于机器翻译:人工智能的兴起,很多时候利用大语言模型能获得相比传统机器翻译很好的翻译质量。这也意味着对于机器翻译的定义有了新的挑战。如果这些非人工翻译和人工翻译的质量类似,那我们既无法判断,也无法限制。当然,这也不是说提倡使用非人工翻译,从根本上来说,我依然是推荐人工翻译为主,非人工翻译为参考——不是让大语言模型来帮人工翻译润色,也不是在非人工翻译的基础上人工润色。
  • 对于繁简转换,在维基百科上所有中文都是系统自动转换的,是因为他们有一套完整的系统——W:ZH:WP:LC,不仅是硬件上自动转换的系统,还有其他处理错误转换的流程。类似的系统在中文我的世界维基上也存在——[1]。我之所以投了容忍,一个是因为不想让这项投票那么难看——大家都投杜绝,因为我们也可以实施这样的系统,虽然需要很大的精力来做出转换表。另外,如果字词转换根据了当地用语做了正确调整,我们为什么还要限制呢。
  • 对于自动程序,选项的描述确实是让人很难选,自动程序的定义又是什么呢?我那种替换文字属于自动程序吗?容忍和非机翻原则选项的区别和关系又是什么?看起来大家对于合作编辑的积极性不是很高。而我本人也逐渐变得很繁忙。相比把翻译了一半的页面留在那里,我也在考虑是不是要全身心的退出中文军团要塞维基的编辑了。关于推广选项——有的页面确实没有什么可以自动替换文字的,做起来反而会浪费时间,所以并不是所有页面都要推广自动替换的使用。
  • 对于处理方案,我也没有想到两个选项之间有什么具体的不同,对于机器翻译或拙劣翻译,应该是要“先礼后兵”首先来提醒,然后根据条目质量来保留或删除的;对于判断的方法,应该是要“自由裁量”的。维基百科的W:ZH:WP:GF假定善意原则说的很好:”既然我们允许任何人编辑,则必然:我们假定编者的编辑和评论都是出于善意的。大多数编辑的人都是在帮助这个计划,而不是伤害这个计划。如果不是这样的话,像维基百科这样的计划从一开始就注定会失败。“希望大家有时间都能读一读里面所有的内容。
User:BEUFK Pictogram plus.png + Pictogram plus.png + Pictogram plus.png + Pictogram plus.png + 1.关于机器翻译问题:目前的机器翻译软件发展并没有成熟,仍然无法比较过手工翻译。(参见帮助:语言翻译)故投“杜绝票”
2.关于自动程序问题:观察了User:AlexT正则表达式公式页面,发现这种方式不失为省去那些繁琐过程的好方法。当然,也看到了Profiteer提出的那些问题,不知道AlexT会如何处理。总的来讲,不只是简体中文区,整个TFWiki都应该以包容的态度面对这种创新的编辑方式。然而,这种方法不适用于那种变数因素多的内容(如对饰品的外观描述),故填“非机翻原则”
3.关于简繁转换的问题:繁体页面目前由于缺少活跃编辑者更新,部分页面可能已经滞后,直接转换估计问题更大,故选“杜绝”。(若条件允许,可以使用Editnotice放置于所有简体/繁体编辑页面中作提醒)
4.关于处理方案:“我们在面对自己的同志时,不能使用‘残酷斗争’‘无情打击’的手段,要以批评教育为主。”如果创建问题页面的用户仍存在活跃倾向,那么我们需要对其进行善意提醒,并且提供必要的协助以改正。当然,如果是永久无活跃/机器人用户,则直接提请删除即可。
User:Dereko Pictogram plus.png + Pictogram plus.png + Pictogram plus.png + Pictogram plus.png + 无。
这个人的想法在本页其它部分已有所体现。
User:Guest Pictogram plus.png + Pictogram plus.png + Pictogram plus.png + Pictogram plus.png + ①并不支持,过度依赖机翻容易形成“翻译腔”这类不好的习惯,但只要描述够流畅,不会让读者看着云里雾里的就没什么大碍。
②并不了解自动程序,但绝对不支持直接使用机翻来批量处理页面,而且在自动批量处理后请务必及时地做好检查和补充。
③繁体大部分的用词和语言习惯和简体的都存在一些差别,并且繁体的大部分页面都过时了,很多情况下我感觉这更像是一种偷懒行为。
④除非页面糟糕到不成样子(内容基本上没有什么可取之处)或者一眼就能看得出编辑者的态度较差,一般情况下都可以通过提醒原编辑者进行修改或者其他编辑者帮助修改来解决上述问题。
个人倾向是只要能把页面的内容写好,过程如何并不重要。
User:Profiteer Pictogram plus.png + Pictogram plus.png + Pictogram plus.png + Pictogram plus.png + *对于机翻质量的要求:语言通顺,链接正确,维基功能符号使用正确(如:斜体)能让正常浏览的用户不觉得自己是在看AI生成的怪东西。
  • 对于自动程序:我虽然不知道Alex的是什么软件,但是如果我在接下来的几次更新包中看到了更多这种界面,我很有可能后悔今天没投杜绝。
  • 对于繁简转换:繁体中文和简体中文在习惯上的区别有很多,而且在游戏内简中和繁中翻译几乎重合度为0,这导致一些高质量的繁中界面转换到简中后质量反而很差。还有一点是繁中已经很久没有用户来维护/更新了,内容很有可能还停留在3-4年前,在这几年时间里这些内容可能已经更改或被删除。其实我对繁简转换的态度就和机翻一样,质量好就行,但是不符合以上两点的繁中界面几乎不存在。故投杜绝。
  • 投自由裁决的原因是有些界面在编辑者(可能是原作者也可以是别的用户看不下去了稍微修改了)用心打磨后虽然有些问题但是不至于差到需要重写,如果有我上次的那种类型的我还是会不犹豫的加个delete。