来源:Reddit编辑:好困。
【新智元导读】抄袭可耻,但AI可以?刚发布的Copilot就被推上了「侵权」的风口浪尖!网友表示:你再训练都是基于我们的开源代码,这改一改就想用来赚钱真的好么?GitHub和OpenAI联合发布的AI代码生成工具Copilot,酷似(yu)神器。
Copilot不仅可以根据程序员写的几行注释生成相应的代码,还可以根据代码的上下文自动完成整个功能。
在拥有1750亿个参数的GPT-3语言模型的加持下,其核心的Codex模型经过了GitHub数十亿行开源代码的训练。
很显然,Copilot的效果非常令人满意,用过的人都赞不绝口。
“Copilot似乎很清楚我接下来要进入什么,在处理React组件时Copilot特别有用,可以做出非常准确的预测。」
GitHub首席执行官纳特·弗里德曼(Nat Friedman)也非常兴奋地说:“每天都有数百名GitHub开发者在使用Copilot。如果预览版进展顺利,我们将计划在未来的某个时候将其扩展为付费产品。」
等等,GitHub,这是一个经过一波运营后,把开源代码变成“付费”的产品吗?
网友顿时炸开了锅。你以为这个姿势是无视通用公共许可吗?
“他们承认Github Copilot接受了很多GPL(通用公共许可证)代码的培训。这不就是把开源代码清洗成商业产品的一种形式吗?“它通常不会复制准确的代码”的说法很难令人满意。」
根据维基百科的解释,GNU通用公共许可证(General Public License),中文译为通用公共许可证,简称GPL,是一系列自由软件许可证,可以保证用户运行、研究、共享和修改软件的自由。
同时,GPL是Copyleft许可,这意味着任何衍生作品都必须遵守相同或等效的许可条款。
GNU官网对GPL的解释是,如果要向公众发布修改后的GPL代码,需要提供源代码。
https://www . GNU . org/licenses/GPL-FAQ . zh-cn . html #语言-容器
GPL许可证系列一直是开源软件领域最受欢迎的软件许可证之一。其中就有著名的Linux内核。
对于Linux的成功,GPL在其中也起到了至关重要的作用,它保证了为内核做贡献的程序员自由工作,而不是被别人利用。
对于Copilot用基于GPL的代码进行训练,网友总结道:“GPL明确表示‘不要把我的工作放在专有软件中’,而Copilot是一种把他们的工作放在专有软件中的机制。」
有网友不解:“为什么这是个问题?GPL不是说可以自由分享和修改代码吗?」
“是的,GPL允许代码共享和修改,但它必须作为GPL发布。」
也有网友说“你怎么知道你想出来的代码不是GPL的?」
“但是,人类也是通过阅读开源代码来学习的,所以这不是一回事吗?」
“不,人类有抽象的理解能力和广博的知识可供参考,而统计模型没有。」
“人类开发人员是不是通过对大量封闭和开源项目的训练,以及对他们隐藏为片段的代码的反刍,来创造衍生作品?」
“嗯,是的,如果你“隐藏”了一段GPL代码,然后复制粘贴到一个商业项目中,听起来就像是违反了许可。」
对于他人代码的商业化,甲骨文起诉谷歌侵权可以说是一个非常著名的案例。
其中争议的焦点集中在Java的一些API和大约11000行源代码的使用上,这些都是甲骨文所拥有的,而谷歌在早期的Android操作系统中使用。
甲骨文提起诉讼,声称这些API受版权保护,要求谷歌从侵权安卓版本的销售和许可中获得88亿美元的损害赔偿。
尽管地区法院层面的两次陪审团审判支持谷歌,但联邦巡回法院推翻了这两项决定,声称API受版权保护,谷歌的使用不是合理使用。
2019年任期内,谷歌成功向最高法院申请审理此案,重点是API的版权和后续合理使用。2021年4月,最高法院以6比2的裁决裁定谷歌使用Java API是合理的。该决定推翻了联邦巡回法院的裁决,并将案件发回重审。
网友调侃:“谷歌某处:”我们有0.1%的几率从甲骨文中逐字复制一小段代码。我们应该使用它吗?』」
被视为版权作品的衍生作品必须包括原作品的“实质”部分。Copilot自动生成的五行功能,在法律领域不会被任何人视为“衍生作品”。」
如何看待学习开源代码后的AI,重新组装重用,而背后的公司却用这个AI赚钱?
参考资料:
https://www . Reddit . com/r/programming/comments/oaxyxu/github _ copilot _ as _ open _ source _ code _ laying/
https://www . GNU . org/licenses/GPL-FAQ . zh-cn . html #语言-容器
结束-
欢迎点赞~关注新智元,及时了解人工智能新动向~
最新评论