作品不再是被创作，而是被发现

最近脑洞大开，也不知道国内外有人这么做过了没。

就是我们可以认为作品已经是"存在的"，比如音乐、文学著作。相当于排列组合生成了"原矿"之类。
然后就是语义算法的找出有价值的"宝石"的问题了。

比如3000汉字+字符(逗号、句号、感叹号、问号)+段落符号。用云计算算出2万字的作品...

然后用语义算法算出可能对人类有价值的作品。再让人工挑选，这样作品是发现，而不是创作了。

音乐同理，多少分钟的音乐旋律，声调+音符+乐器风格(电子、摇滚)

然后发现者可以打上版权信息，然后进行版权小额交易。

VirgilMing

2015-06-03 09:50:02 +08:00

@em70 RESTful 和一台机运行多个系统实例是很难想象的吗…

mailsuhua

2015-06-03 10:07:29 +08:00

这和科技算命一个概念

em70

2015-06-03 10:08:01 +08:00

@VirgilMing 你觉得自己只是一台复杂的机器吗,每一个动作都是编好的程序,只不过足够复杂而已.

cacoo

2015-06-03 10:11:38 +08:00

这里更多想讨论在工程方面的实现的可行性，比如之前有人提到存储的问题，那么可能的解决方式是产生作品后先用算法过滤，合适的就留下来，不合适的就保存一个产生作品的算法形式而不是保存作品实体，以便以后有人可以查看这个不合适的作品...

而且我更多的是考虑一种网站服务的形式，作为一种流水线/机制，而不是单机程序

@youdu 还是考虑在现有的版权法规的框架下，如果由此带来的版权变革先不考虑。

@bjhyyc 为什么你认为这是一种退化？你是说人类创作作品是因为人能创作作品是作为自然进化、选择的结果吗？我这里考虑的是一种工业的方式，而不是从自然的的角度

@jiayao321 科学理论面向的实际用户太少了，音乐作为可以跨国界、跨种族，文学作品需要翻译所以不如音乐。

Koradio

2015-06-03 18:37:06 +08:00

这个说法看似简单易懂,但隐含了一个很有争议的条件.

即创造的价值是能被衡量的
一个创作的作品是否能被看作有"价值",是美学价值呢,社会价值还是潜在价值?

这个问题的难点不在于如何去实现它,而是编算法的人怎么去编.

roricon

2015-06-03 20:48:11 +08:00

刘慈欣 <诗云>

lavande

2015-06-03 23:35:12 +08:00

不管是把创作描述成被创造还是被发现，这都无所谓
实际上lz要做的东西很简单，就是“机器辅助创作”

举个例子，类似苹果的garage band，稍作改动：
首先，我分析一下大多数摇滚歌曲的和弦走向，基于统计学（隐马尔可夫什么的）做出一个模型;
然后，为用户生成一套符合规律的和弦走向；
最后，用户用这套走向继续创作歌曲。

当然，这个是非常简单的了，我还可以用同样的方法做下列的东西：和弦的具体演奏方法（节奏型），节奏，主旋律，配器（乐器种类和编配套路），歌词等等……
最后用户做的就是，让机器先生成，听听看好听不，好听就留下，不好听再来，或者觉得凑合，自己再手动改改。

这是这个东西我是认为需要机器做一半人再做一半的，机器（或者说模型）还没有强大到可以生成一个“成品”且不需要任何人工改动就很让人满意，所以很难直接“生成+挑选”的模式，最多是计算机生成一个半成品，或者适当时候给个“启发”，然后让人去完成最后的成品工作。

从信息论的角度来考虑，从最早的不确定组合，到最后的确定的作品，这里需要用以解决不确定性的信息熵总归是那么多，就是看你从哪弄来这些信息。

cacoo

2015-06-04 09:49:48 +08:00

@Koradio 这个价值就是商品价值、交换价值、商业价值。这个取决于人自身的判断和喜好。

@lavande 你说的意思是对的，就像《失控》里讲的，定向进化。但我这个机制和进化还是有一点差别，在于定向进化是先有个点，然后选取"优"的基因进行人工定向进化，而我这个是规则生成原材料，然后让算法去粗筛，人工细选。

根本上就是初始参数是否为一个确定值。

Koradio

2015-06-04 17:09:03 +08:00

@cacoo 很多所谓的名著都不是具有高商业价值的.作为商品需要具备大众可购性,或者类似于小众奢侈品具有高度学术性,作为商品的流动性必须需要一个认同它作为商品的共同体.但是取决于人自身的判断和喜好,这一点恰恰是和作为商品的必要性所矛盾,我喜欢的,我认为是名著的东西并不一定是别人所认同的.

艺术创作并不是能被价值所衡量的,因为价值本身就是一个很主观的概念,想要通过算法得到其价值的过程恰恰便是一个"去主观化"的过程.

这样做,很可能只能得到烂俗的作品,真的是你的初衷吗?

dallaslu

2015-06-05 08:53:27 +08:00

「文章本天成，妙手偶得之。」

cacoo

2015-06-05 09:20:29 +08:00

@Koradio 你的问题实际存在，但如果这个系统研发出来，还是要实际运行一下看看。

lavande

2015-06-05 10:45:49 +08:00

其实我对这个挺感兴趣的，还是引用一下名言吧：
"Talk is cheap. Show me the code/demo"

cmheia

2015-06-05 10:49:09 +08:00

曾经有过类似的脑洞……

cacoo

2015-06-05 10:59:19 +08:00

@lavande 唉，要我会写code就不会在奇思妙想版区发帖了...本意是召唤大神来讨论下写code(工程实现)的问题...
比如之前有人提到存储问题就很好...

ianva

2015-06-05 11:26:21 +08:00

不懂文学的人

lavande

2015-06-05 15:50:09 +08:00

@cacoo 我估计作为“个体户”，搞出3000字的小说是非常困难的，因为没有那个计算能力，除非能找到超级计算机给你用……
另外就是lz的三个步骤我觉得不是太合理，1和2其实是可以合并的，因为1生成出来的东西可以说99%甚至更多是垃圾数据，不如在每一次生成时就套用一次2中的规则，符合则储存，不符合直接丢弃，不然太浪费储存。所以说到底其实就是利用规则直接穷举文本，而这个穷举出来的每个文本都应该是人类可读的，所以这个规则（模型）要非常非常强大，这就得有很大的语料库让你来训练模型了吧……建立这个语料库估计是个苦差事

我们来做点“小”工程吧，比如缩小到“国内独立民谣音乐人歌曲的歌词”，说一下我的做法：
1、收集国内独立民谣音乐人的名单，然后收集每个人的所有作品的歌词；
2、将这些歌词处理，建成语料库；
3、分析语料，构建（找）一个合理的语言模型；
4、训练这个语言模型；
5、用这个模型穷举可能的歌词作品（最后可能发现最好给个主题限制，不要穷举比较好）；
6、人工判断是否可用，或后续修改和润色，完成。

lavande

2015-06-05 15:53:28 +08:00

不过想想这个工作，给人工来做反而更高效。
一个有趣的经验就是，“读书破万卷，下笔如有神”
其实你的大脑里有个模型，在读书时候在不知觉地训练，最后当你输出时发现这个模型已经被训练得很厉害了，写出了好文章。
只是我们不太清楚大脑究竟是怎么工作的……

cacoo

2015-06-05 16:20:42 +08:00

@lavande 恩，就实际操作来说，确实1、2合并，但从逻辑上来说还是拆开讲明白一些。至于超级计算机，现在可以用云计算，比如阿里、亚马逊，按需使用即可。
你说的例子，以一个有限的点展开，确实可以实际落地操作。但我这个可以说让大家自由发挥。两者不冲突，可以兼容。

至于你说的人工做反而更高效，我可以认为这是自然选择(进化)下的一种模式。只不过现在要用代码/工程角度复现(逆向)这个罢了。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/195458

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.