02书屋 > 大明1805章节目录 > 第616章 机器智能学习创造系统

第616章 机器智能学习创造系统


第616章  机器智能学习创造系统

        大公三十四年年底,朱迪钚再次来到朱靖垣的住处,送上了一套最新的计算机和软件系统。

        “机器智能学习创造系统”。

        类似于朱靖垣前世的人工智能,不过是一个相对完整的软件体系。

        由于朱靖垣在最开始的时候的提示和引导,朱迪钚开发模拟世界和各种游戏的过程中,一直都在孜孜不倦的研发更加真实的机器智能。

        不过早期基本上只应用在游戏中,最近十来年才逐步有了其他的现实应用。

        比如说人脸识别、物品分拣、驾驶辅助、智能语音等等。

        最近这几年,这些重要的基础能力,一直都在不断地升级换代。

        同时在功能范围上也有了新的突破。

        已经可以与用户智能聊天,可以使用语音控制设备。

        可以根据标题和框架生产文章,根据关键点和元素生成图像。

        根据语音段落生成智能语音库,根据游戏台词直接生成语音。

        还可以修缮和改造现有图片、视频、游戏画面和声音。

        正在提供越来越多的丰富多彩的智能化应用。

        在大公三十四年底,借着新一代小型计算机量产完成,朱迪钚对这些功能做了一个归纳整理。

        朱迪钚将这些功能统称为“机器智能学习创造系统”。

        朱靖垣看了之后颇为满意,但是摆弄了一会儿却轻轻的叹了口气。

        大明的科技水平,开始在越来越多的方面超过前世了,但是自己也已经真的老了。

        今年自己已经六十四岁了。

        虽然相比两个世界的同龄人而言,自己现在的身体状态其实是很不错的。

        但与自己年轻时候对比,差距就越来越明显了。

        头上的白发也越来越多了,身体也越来越不灵活了,脑子也越来越迟钝了。

        朱迪钚不知道父亲为什么叹气。

        正想要问问的时候,朱靖垣已经开口吩咐仆人了:

        “叫迪镧过来……”

        然后朱靖垣开始问朱迪钚,他这些智能系统的训练逻辑。

        等到朱迪镧过来之后,朱靖垣就让朱迪钚给他简单说了这些程序的情况。

        然后朱靖垣直接问了一个问题:

        “迪镧,你是大宗伯和刑律院院长,主管文化与法律。

        “觉得应该如何处理机器学习的使用的素材的所有权问题。”

        朱迪镧听了之后随口就说:

        “儿臣觉得很简单啊,直接付费授权就是了。”

        朱靖垣马上追问:

        “机器学习收费的逻辑和理由是什么?立法是要有说的过去令人信服的道理的。

        “如果机器学习需要收费的话,那普通人学习已经公开的书画作品,是否也需要收费呢?”

        朱迪镧理所当然的说:

        “学习本来就要付费的。

        “不谈学习者自己学习过程中的消耗,例如笔墨纸砚和计算机等等设备。

        “也不谈上学和聘请老师的费用。

        “单纯的自行购买学习资料,学习用的原材料和学习内容,本来就是要花钱的。”

        朱靖垣伸手指着屏幕上的书画生成软件:

        “那创作者已经免费在现实中或者互联网公开的书画作品,他人学习的时候显然是不需要付费的。

        “这个以别人的书画作为学习材料的程序,也需要对所有用到的书画作品付费吗?

        “我记得很多书画家都在互联网上免费公开过自己的作品。

        “只要不用于盈利行为,通常都会允许别人临摹学习,甚至还有人会主动指点。”

        朱迪镧稍微整理了一下语言:

        “父皇,按照大明现有的法律,创作者主动免费公开的作品,他人不得用于任何以盈利为目的行为。

        “这个盈利包括直接和间接的盈利,也包括现在不盈利但未来盈利的行为。

        “那些热心的大师们,通常也不介意他人先模仿自己的作品,再去创作风格类似的不同作品。

        “只要对方不照搬他们的设计,另外用于盈利行为也无所谓。

        “也觉得是理所当然的做法。

        “站在律法的角度看,没有矛盾的根本原因,还是因为没有利益冲突。

        “免费公开作品的创作者,其实有一种理所当然的,在过去也是基本正确的心态和认知。

        “首先是别人除非直接抄袭,否没办法简单利用自己的作品获利。

        “就算是他人学习自己的风格去再创作,也需要需要花费大量精力去完成创作。

        “对方要亲自动手,一个字一个字的写,一根线条一根线条的画。

        “对方的创作速度与自己不会有明显区别。

        “绝大部分情况下,学习者的知名度和收益水平,也都不会比原创者更高。

        “学习者通常还会尊敬原创者,将对方视为老师。

        “这有可能为原创者带来声望加成,甚至有可能会带来能够直接提供金钱的客户。

        “这种情况下学习者和原创者之间当然没有矛盾。

        “一旦学习者与原创者使用高度相同的风格,但是学习者的作品热度超过了原创者。

        “那双方的关系就可能会迅速下滑。

        “学习者与原创者的风格类似,完成度比原创者自己更高,知名度也会超过原创者。

        “就算是能够提供收益的客户,也会变成学习者的客户。

        “而不再是自己的潜在客户了。

        “这时候学习者就会变成发扬光大者,原创者就变成了一个点子提供者或者风格创始者。

        “就算是在这样的基础上,只要学习者仍然尊重原创者,双方的关系通常也不会变得太差。

        “因为发扬光大者会为落寞的原创者提供额外的知名度。

        “同时,发扬光大者也是一个人,创作的速度受限于人体的极限。

        “在订单增加的情况下,风格相似的原创者有机会获得额外的实际利益。

        “双方的利益冲突仍然不明显,利益仍然是趋同的。

        “如果学习者发明了一个机器,可以将原创者的稿件投入进去,瞬间生成无数类似的高质量作品。

        “并且用这些大机器生产出来的‘廉价工业品’赚大钱。

        “那原创者绝对会暴怒。

        “所以我们不需要什么复杂的具有说服力的理由。

        “只要规定机器学习需要收费,现有的原创者绝大部分都会直接支持这种规定。

        “因为机器很可能会让他们得不到收益了,自己会被对方的机器迅速取代,失去绝大部分生存空间。

        “就像传统的手工织布工人与机械化纺织机一样。

        “不过,手工纺织工人与机械化纺织机的关系,与书画创作者和机器学习智能绘图的关系并不相同。

        “手工纺织技术的发明者无法确定,手工纺织工人只是掌握技术的工人。

        “工人的纺织过程本身不存在创造性。

        “其他人发明和购买机械化纺织机器,与工人并无直接的冲突和侵权行为。

        “但是,如果工人自己设计了一种纺织图案和花纹,而不是传承多代人的常见图案和花纹。

        “那使用机械化纺织的工厂,在未经工人许可的情况下使用相同图案,就是法律所禁止的侵权行为。

        “而机器学习的对象,恰好都是有创造性的产品,绝大部分都是有版权的产品。

        “所以机器学习应该取得学习目标的版权所有人的授权。”

        朱靖垣听完之后看向朱迪钚:

        “老二你认可这个理由吗?”

        朱迪钚直接说:

        “镧弟……你这样的说法是没有道理的,机器学习与纺织工人设计图案的比喻也是在狡辩。

        “机器学习的过程,以及后续再创作的过程,都是与人的学习没有本质区别的。

        <div  class="contentadv">        “人学习别人的作品,本质上也是将作品元素完全打碎,变成分子乃至原子状态存进脑子里面。

        “然后再自行组合这些原子状态的素材,组合出与原作看上去截然不同的作品。

        “只是这些原子太小了,根本无法鉴别出于原作的直接雷同点。

        “其实只是人类鉴定抄袭的规则基础上,继续向下无限细分到人类无法认知为止。

        “相同的设计图案和段落是不是抄袭?相同的人物结构和大纲算不算抄袭?

        “相同的抄设计元素和诗句算不算抄袭?相同的线条风格和词组算不算抄袭?

        “相同的颜色范围搭配和词库范围算不算抄袭呢?

        “这样继续细分下去,人类学习到最后使用可能是类似的颜色范围和词库。

        “机器学习的深度可能比这个更加深入和细化。

        “伱用人类法律鉴定抄袭的标准,去鉴定机器学习创造出来的作品,是绝对鉴定不出抄袭来的。

        “类比手工织布工匠和机械化纺织机的相同,只能算是使用了类似的棉花和颜色。

        “所以为什么人类学习不算抄袭,机器干同样的事情就是抄袭?

        朱迪镧笑着说:

        “二哥你你可能理解错了我的意思。

        “我没说机器学习和创造是抄袭,而人类的学习和创造不是抄袭。

        “其实按照我自己的观点,两者都应该算是抄袭。

        “就像二哥你说的,只要鉴定抄袭的标准无限深入,所有的学习都能够判定为抄袭。

        “在这样的基础上,任何免费学习过别人的艺术作品的人,都不应该创作任何以盈利为目的的作品。

        “想要创造以盈利为目的的作品,本人的所有的学习资料都应该是取得了盈利授权的材料。

        “因为只要学习过,显然就会受到或多或少影响,不然也就不能称之为学习了。

        “是否为抄袭的判断标准,更加准确的说法是允许抄袭到什么级别。

        “二哥可以参考微积分和相对论的逻辑来理解这个说法。

        “在这样的基础上,现实中的人类社会和人类创作者,已经经过实际上的社会实践和法律,默认授权了其他人类拥有特定级别以下的抄袭盈利许可。

        “但是,人类还没有授权机器使用任何级别的抄袭盈利标准。

        “比如说,我画了一幅画,默认允许二哥你学习画法。

        “我允许你把我的画的原子结构甚至分子存在自己的脑子里随时使用。

        “但没有允许你把他们存在机器里面供机器使用。

        “机器要学习就要另外要授权。

        “因为你说了,机器学习的逻辑,与人是相同的,但机器恰好又不是人类。

        “机器学习相关又没有任何现行法律。

        “机器学习还没有大规模出现,我并没有直接给过它授权,更加没有给过事实授权。

        “甚至没有给过你使用机器学习的授权。

        “现在,我们要拟定相关法律,决定默认授权机器学习到什么程度。

        “我的建议是全部非默认,任何用于机器学习的资料,都必须得到创作者的直接授权。

        “这样做的目的不是为了阻止机器学习继续进化。

        “恰恰是要规范机器学习行业。

        “未来是大数据的时代,机器学习的规模必然会越来越大。

        “如果不限制机器学习的范围和规则,必然导致这个产业的混乱发展。

        “必然导致机器学习开发者互相抄袭且不可控。

        “抄袭数据原子当然不是抄袭,那抄袭数据库肯定就是抄袭了吧?

        “就像照搬一个字库的范围不算抄袭,但照搬一本大词典那就绝对是抄袭了。

        “在大数据和机器学习的新时代,数据资料应该是有新的权属规范。

        “任何数据和资料,都应该是有权属的,都是有价值的。

        “我认为这应该是下个时代的时代逻辑。

        “有了这样的基础规则,有了规范的收费和授权的基本规则。

        “相应的数据模型开发者,才有机会将通过有授权的数据,开发出同样有授权的数据模型。

        “进而可以不受额外限制的使用机器生产的产品去盈利。

        “否则,任何机器学习最终产生的作品,其著作权归属都是模糊和敏感的。

        “机器不是人类,所以人类可以不保护机器的著作权,完全不认可机器创作的作品的著作权。

        “只有将机器视为人类的机器,创作的作品的著作权属于其主人所有。

        “才能以人类著作权的逻辑获得保护并盈利。

        “但人类想要利用别人的素材盈利,就必须获得对方的授权了,这样也就形成了清晰的著作权归属。

        “透过现象看本质的话,用机械智能完成以前只有人能够完成的工作,并且讲产量和速度提升几十几百倍,是又一次的产业革命。

        “生产力会再次跨越式的提升,技术能够覆盖的产品的生产成本会大幅度下降,由此产生的效益大幅度提升。

        “为智能机器成功运行起来提供原料的人,有分享这种生产力提升所带来的利益的权利。

        “不能将个人欣赏学习的授权许可,用于研发和制造任何生产工具。

        “这样数据资料有价论的逻辑也就清晰了。”

        朱靖垣听完之后看向朱迪钚:

        “老二你怎么看?”

        朱迪钚沉默思考了几秒钟,最终慢慢的点着头说:

        “我觉得迪镧的话有道理……

        “用微积分的逻辑来评判和区分学习、模仿、抄袭的界限是个很不错的理念。

        “未来的公共网络平台上,创作者上传自己的作品的时候。

        “应该有一个是否允许机器学习的选项。

        “同时也应该有一个是否使用大数据筛选和推荐信息的选项。”

        朱迪镧听了马上附和说:

        “我赞成二哥的意见。”

        朱靖垣笑着说:

        “既然你们哥俩都觉得可行,那这些事情就这么定了吧。

        “不过问题是,你们怎么判断一个数据模型,是否用了未经授权的材料来训练呢?

        “在数据分析层面你们有办法区分吗?”

        朱迪钚想了想说:

        “可以在未经授权的素材中添加一些验证数据,规避未经许可的机器学习的使用甚至污染数据模型。

        “不过……单纯依靠技术手段是不行的,无法完全规避违规者的破解和甄别以及反破坏技术。

        “所以还是要用社会和制度层面的限制以及事后处置方法……”

        朱迪钚说到这里看向了弟弟。

        朱迪镧想了想说:

        “制度上有两个方向,一个是默认全部授权,同时默认全部收费。

        “目前互联网上的大规模艺术作品平台,都是朝廷和四大产业集团的官方平台。

        “民间厂商和用户想要自行建立数据模型,只能从这些平台上采集数据。

        “所以可以规定,没有向现有平台之一付费取得授权资格的厂商,都直接按照违规处罚。

        “另一个方向,是就由四大产业集团出面,各自设计一套基础软件框架。

        “相当于一个带有强制过滤和筛选功能的装置。

        “民间厂商做任何的数据训练,必须在这个基础软件框架之上开发。

        “也就是放在这个过滤装置之内。

        “这个过滤程序自动甄别未经授权的材料标记,直接不将未经授权的材料投入训练过程。

        “同时互联网上应该在授权和未授权的材料上加入专门标记。

        “供过这些滤装置直接识别。

        “这些方案可以与二哥的技术方案同步实行。”

        朱迪钚听了不由得点头:

        “好,识别和反训练技术是必须开发的。”

        朱靖垣也没有评价两人的设想,就让朱迪钚和朱迪镧哥俩商量着办了。


  (https://www.02sw.net/3213_3213023/115639351.html)


1秒记住02书屋:www.02sw.net。手机版阅读网址:m.02sw.net