一段音频用 2 倍播放,同时录音.那么录完音以后的音频用 0.5 倍速播放的效果和原始录音正常速度播放同等效果么?

2019-08-31 17:58:56 +08:00
 vazo
6437 次点击
所在节点    问与答
50 条回复
ciaoly
2019-09-01 00:12:52 +08:00
数字信号处理挂科的学渣抛个砖头:离散信号做 2t 变换时损失一半时域数据,再做 0.5t 变换也无法弥补;但是时域连续信号可以。
菜逼本人,水平仅限于此了。
cskeleton
2019-09-01 01:05:24 +08:00
@KyonLi #1 如果这个过程中,加速播放又转录不会有任何音质损失,也就是说没有信息丢失的话,而且转录也没有改变音频的编码算法,那么这个加速转录后的音频文件体积应该不变才对。
MonoLogueChi
2019-09-01 02:04:37 +08:00
@vazo 你输出采样是不变的,加速一倍就会有一半的信息丢失
widewing
2019-09-01 04:10:14 +08:00
lz 你是不是想说信息论里的信息和一般说的信息不是一个概念?
Travers
2019-09-01 05:16:19 +08:00
这就是一个很简单的采样问题,学过数字信号处理的应该都清楚吧。建议楼主了解一下奈奎斯特采样定律。
只需要一个音频的频率,低于采样(按照你的说法也就是录音)频率的 1/2,即 Nyquist 频率,通过这个录音设备录制这个音频,就可以采集到所有信息,最后通过采样信号可以完全重建原始信号。
一段音频用 2 倍播放 -> 这个音频的频率翻倍。假设采样频率为 44.1khz,而这个音频的频率是 10kHz, 频率翻倍之后为 20kHz,依然低于 44.1 kHz /2 =22.05 kHz 的一半,那么最后通过采样信号能够完全重建原信号。即“一段音频用 2 倍播放,同时录音.那么录完音以后的音频用 0.5 倍速播放的效果和原始录音正常速度播效果等同。”
而如果原来音频频率的 2 倍大于了采样频率的一半,信号就会发生混叠失真,效果就不等同了。
只要你的播放设备足够好(能输出高频的音频),和录音设备足够好(采集频率够高),且满足奈奎斯特采样定律,就能实现楼主所说的效果。
当然 Nyquist 采样频率也不是一定的,近几年提出的压缩感知 (Compressed sensing) 算法就突破了 Nyquist 采样频率。不过这就是另外一个话题了。
hugee
2019-09-01 07:32:34 +08:00
@netlous 什么⊙∀⊙? md5 是 16 字节?
amazingrise
2019-09-01 08:51:43 +08:00
@vazo 字体 20 号放到 10 号再放到 20 号,和这个不是一码事。字体不是一幅位图拉来拉去。对于点阵字体而言,你可以理解为多个位图的一个集合,需要时输出不同的(预先存储的)位图。对于矢量字体而言,每个字显示在屏幕上都是渲染出来的,是根据曲线方程(大致这么理解吧),用屏幕上的像素拟合出来的图形。
zw1one
2019-09-01 09:35:08 +08:00
别看声音的时域,看频域把
vazo
2019-09-01 09:39:50 +08:00
@Travers 多谢学霸.
vazo
2019-09-01 09:41:18 +08:00
@amazingrise sorry,字体放大这个比喻确实不恰当.
ThirdFlame
2019-09-01 09:53:15 +08:00
图片 缩小一半,截图。 然后再放大一倍。
图形照样能看的出来(就像楼主说的读 1-60 ),但是细节丢了啊。
vazo
2019-09-01 10:14:44 +08:00
声音是一种波,只要能把频率最高采集出来至少 2 个点就能还原,比这个频率低的更不在话下.图片和字体放大缩小和这个类比是不合适的.
qiayue
2019-09-01 11:53:02 +08:00
@hugee md5 得到的结果是一般显示为 32 个字符的字符串,实际每 2 个字符是一个字节,总共 16 字节。
1 个字节 8 位,2 的 8 次方是 256,转化为 16 进制为 ff,所以 1 个字节需要 2 个字符( 0-9a-f )表示。16 个字节需要 32 个字符。
deorth
2019-09-01 12:06:19 +08:00
。写了半天发现#25 已经有了。我数字信号处理挂了三年,也知道奈奎斯特采样定理
ipwx
2019-09-01 12:10:41 +08:00
@Travers 没有突破。解码后数据的信息量等于压缩后数据的信息量加上解码器自身的信息量。
loading
2019-09-01 12:20:49 +08:00
波形数据,按采样定律来,和信息熵不矛盾。
chinvo
2019-09-01 12:21:14 +08:00
@vazo #31 但是声音采样出来的数字“波形”在你 x2x0.5 的操作之后是不一样的
zhujinliang
2019-09-01 12:35:13 +08:00
以前的双卡座录音机会有一个倍速转录功能,播放一端倍速播放,录音的一端也以相同的速度录音,最后以小于正常播放的时间复制出一盘磁带
倍速复制出的效果和正常速度的相比能差多少,没有试过,我小时候磁带已经是很容易买到的时代了,没有复制需求,根本就没考虑过这个问题
vazo
2019-09-01 12:52:27 +08:00
@zhujinliang 两盘是一样的
jinliming2
2019-09-01 12:55:51 +08:00
@vazo
如果是矢量数据,那么即便是缩小,再放大,还是能还原的。但是你提到了“录音”,这个过程就是模拟信号了。
就像一幅 1900*1100 分辨率的图片,你缩小到 19*11 分辨率展示,然后截个图,再把截图后的画面放大回 1900*1100,你想想还能得到原来一样的高清无码大图吗?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/596784

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX