作品不再是被创作,而是被发现

2015-06-02 10:12:16 +08:00
 cacoo
最近脑洞大开,也不知道国内外有人这么做过了没。

就是我们可以认为作品已经是"存在的",比如音乐、文学著作。相当于排列组合生成了"原矿"之类。
然后就是语义算法的找出有价值的"宝石"的问题了。

比如3000汉字+字符(逗号、句号、感叹号、问号)+段落符号。用云计算算出2万字的作品...

然后用语义算法算出可能对人类有价值的作品。再让人工挑选,这样作品是发现,而不是创作了。

音乐同理,多少分钟的音乐旋律,声调+音符+乐器风格(电子、摇滚)

然后发现者可以打上版权信息,然后进行版权小额交易。
6242 次点击
所在节点    奇思妙想
58 条回复
VirgilMing
2015-06-03 09:50:02 +08:00
@em70 RESTful 和一台机运行多个系统实例是很难想象的吗…
mailsuhua
2015-06-03 10:07:29 +08:00
这和科技算命一个概念
em70
2015-06-03 10:08:01 +08:00
@VirgilMing 你觉得自己只是一台复杂的机器吗,每一个动作都是编好的程序,只不过足够复杂而已.
cacoo
2015-06-03 10:11:38 +08:00
这里更多想讨论在工程方面的实现的可行性,比如之前有人提到存储的问题,那么可能的解决方式是产生作品后先用算法过滤,合适的就留下来,不合适的就保存一个产生作品的算法形式而不是保存作品实体,以便以后有人可以查看这个不合适的作品...

而且我更多的是考虑一种网站服务的形式,作为一种流水线/机制,而不是单机程序

@youdu 还是考虑在现有的版权法规的框架下,如果由此带来的版权变革先不考虑。

@bjhyyc 为什么你认为这是一种退化?你是说人类创作作品是因为人能创作作品是作为自然进化、选择的结果吗?我这里考虑的是一种工业的方式,而不是从自然的的角度

@jiayao321 科学理论面向的实际用户太少了,音乐作为可以跨国界、跨种族,文学作品需要翻译所以不如音乐。
Koradio
2015-06-03 18:37:06 +08:00
这个说法看似简单易懂,但隐含了一个很有争议的条件.

即创造的价值是能被衡量的
一个创作的作品是否能被看作有"价值",是美学价值呢,社会价值还是潜在价值?

这个问题的难点不在于如何去实现它,而是编算法的人怎么去编.
roricon
2015-06-03 20:48:11 +08:00
刘慈欣 <诗云>
lavande
2015-06-03 23:35:12 +08:00
不管是把创作描述成被创造还是被发现,这都无所谓
实际上lz要做的东西很简单,就是“机器辅助创作”

举个例子,类似苹果的garage band,稍作改动:
首先,我分析一下大多数摇滚歌曲的和弦走向,基于统计学(隐马尔可夫什么的)做出一个模型;
然后,为用户生成一套符合规律的和弦走向;
最后,用户用这套走向继续创作歌曲。

当然,这个是非常简单的了,我还可以用同样的方法做下列的东西:和弦的具体演奏方法(节奏型),节奏,主旋律,配器(乐器种类和编配套路),歌词等等……
最后用户做的就是,让机器先生成,听听看好听不,好听就留下,不好听再来,或者觉得凑合,自己再手动改改。

这是这个东西我是认为需要机器做一半人再做一半的,机器(或者说模型)还没有强大到可以生成一个“成品”且不需要任何人工改动就很让人满意,所以很难直接“生成+挑选”的模式,最多是计算机生成一个半成品,或者适当时候给个“启发”,然后让人去完成最后的成品工作。

从信息论的角度来考虑,从最早的不确定组合,到最后的确定的作品,这里需要用以解决不确定性的信息熵总归是那么多,就是看你从哪弄来这些信息。
cacoo
2015-06-04 09:49:48 +08:00
@Koradio 这个价值就是商品价值、交换价值、商业价值。这个取决于人自身的判断和喜好。

@lavande 你说的意思是对的,就像《失控》里讲的,定向进化。但我这个机制和进化还是有一点差别,在于定向进化是先有个点,然后选取"优"的基因进行人工定向进化,而我这个是规则生成原材料,然后让算法去粗筛,人工细选。

根本上就是初始参数是否为一个确定值。
Koradio
2015-06-04 17:09:03 +08:00
@cacoo 很多所谓的名著都不是具有高商业价值的.作为商品需要具备大众可购性,或者类似于小众奢侈品具有高度学术性,作为商品的流动性必须需要一个认同它作为商品的共同体.但是取决于人自身的判断和喜好,这一点恰恰是和作为商品的必要性所矛盾,我喜欢的,我认为是名著的东西并不一定是别人所认同的.

艺术创作并不是能被价值所衡量的,因为价值本身就是一个很主观的概念,想要通过算法得到其价值的过程恰恰便是一个"去主观化"的过程.

这样做,很可能只能得到烂俗的作品,真的是你的初衷吗?
dallaslu
2015-06-05 08:53:27 +08:00
「文章本天成,妙手偶得之。」
cacoo
2015-06-05 09:20:29 +08:00
@Koradio 你的问题实际存在,但如果这个系统研发出来,还是要实际运行一下看看。
lavande
2015-06-05 10:45:49 +08:00
其实我对这个挺感兴趣的,还是引用一下名言吧:
"Talk is cheap. Show me the code/demo"
cmheia
2015-06-05 10:49:09 +08:00
曾经有过类似的脑洞……
cacoo
2015-06-05 10:59:19 +08:00
@lavande 唉,要我会写code就不会在奇思妙想版区发帖了...本意是召唤大神来讨论下写code(工程实现)的问题...
比如之前有人提到存储问题就很好...
ianva
2015-06-05 11:26:21 +08:00
不懂文学的人
lavande
2015-06-05 15:50:09 +08:00
@cacoo 我估计作为“个体户”,搞出3000字的小说是非常困难的,因为没有那个计算能力,除非能找到超级计算机给你用……
另外就是lz的三个步骤我觉得不是太合理,1和2其实是可以合并的,因为1生成出来的东西可以说99%甚至更多是垃圾数据,不如在每一次生成时就套用一次2中的规则,符合则储存,不符合直接丢弃,不然太浪费储存。所以说到底其实就是利用规则直接穷举文本,而这个穷举出来的每个文本都应该是人类可读的,所以这个规则(模型)要非常非常强大,这就得有很大的语料库让你来训练模型了吧……建立这个语料库估计是个苦差事

我们来做点“小”工程吧,比如缩小到“国内独立民谣音乐人歌曲的歌词”,说一下我的做法:
1、收集国内独立民谣音乐人的名单,然后收集每个人的所有作品的歌词;
2、将这些歌词处理,建成语料库;
3、分析语料,构建(找)一个合理的语言模型;
4、训练这个语言模型;
5、用这个模型穷举可能的歌词作品(最后可能发现最好给个主题限制,不要穷举比较好);
6、人工判断是否可用,或后续修改和润色,完成。
lavande
2015-06-05 15:53:28 +08:00
不过想想这个工作,给人工来做反而更高效。
一个有趣的经验就是,“读书破万卷,下笔如有神”
其实你的大脑里有个模型,在读书时候在不知觉地训练,最后当你输出时发现这个模型已经被训练得很厉害了,写出了好文章。
只是我们不太清楚大脑究竟是怎么工作的……
cacoo
2015-06-05 16:20:42 +08:00
@lavande 恩,就实际操作来说,确实1、2合并,但从逻辑上来说还是拆开讲明白一些。至于超级计算机,现在可以用云计算,比如阿里、亚马逊,按需使用即可。
你说的例子,以一个有限的点展开,确实可以实际落地操作。但我这个可以说让大家自由发挥。两者不冲突,可以兼容。

至于你说的人工做反而更高效,我可以认为这是自然选择(进化)下的一种模式。只不过现在要用代码/工程角度复现(逆向)这个罢了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/195458

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX