V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
imes
V2EX  ›  问与答

是否有成熟的音频版“HDR”

  •  
  •   imes · 2022-04-25 09:54:34 +08:00 via Android · 1758 次点击
    这是一个创建于 725 天前的主题,其中的信息可能已经有所发展或是发生改变。
    相比于提升画面质量的 HDR ,音频方面也不可忽视,能极大的提高观感质量。初步想到的应用场景有以下两点:</br>

    1. 自动调节不同音频的音量大小到同一增益。防止因不同视频的增益不一样而导致的“我听不见”和“我聋了”的状况。</br>

    2. 动态调整同一音频不同时域中的增益。比如我想听清楚悄悄话内容,我不想被里面的鬼哭狼嚎震碎耳膜。</br>



    总体而言,个人感觉,最近五年,音频上的技术发展远低于视频方面。
    16 条回复    2022-04-25 15:52:14 +08:00
    BreadKiller
        1
    BreadKiller  
       2022-04-25 09:58:28 +08:00
    1 的话有些播放软件就可以支持,如 spotify
    2 的话你是不是在说 EQ?
    killgfat
        2
    killgfat  
       2022-04-25 09:58:55 +08:00 via Android   ❤️ 2
    有没有可能,动态增益已经是存在了很久的技术了
    BreadKiller
        3
    BreadKiller  
       2022-04-25 09:59:04 +08:00
    #1 不过 EQ 的话是静态的
    imes
        4
    imes  
    OP
       2022-04-25 10:02:20 +08:00 via Android
    @killgfat 2# agc 存在失真问题
    kop1989smurf
        5
    kop1989smurf  
       2022-04-25 10:05:37 +08:00   ❤️ 2
    你搞混了照片和视频中的 HDR 。
    照片的 HDR 是拉平,既原本过曝的变暗,原本过黑的调亮。
    视频的 HDR 是对比度增强。亮的更亮,暗的更暗。对应的就是 hifi 中的高动态范围。

    所以:
    1 、你所谓的视频中的过曝过暗拉平,这个技术并不存在。
    2 、动态调整增益不难,难的是理解你要什么。
    3 、单轨音频的唯一特质就是频率,如果“悄悄话”和“鬼哭狼嚎”在一个频率,无论如何也不可能区分。(除非音频本身是多轨。)
    gainsurier
        6
    gainsurier  
       2022-04-25 10:08:45 +08:00
    啥叫音频版的 HDR ,音频版的 DLSS ?
    音频版的 HDR 对应的是不是更偏向无损音乐这些?

    Overcast 中的 Voice Boost/Volume Boost 不知道是否符合你的需求
    source: https://sspai.com/post/38304
    ynyounuo
        7
    ynyounuo  
       2022-04-25 10:10:45 +08:00   ❤️ 1
    你这是和 HDR 背道而驰的两种想法,HDR 是尽可能的拓宽 DR 而不是把所有东西往中间挤

    你的想法放在视频和图像领域就相当于把 1000 nits 的画面和 50 nits 的画面都调整成 100 - 300 nits 以适应人眼,实际上属于 HDR 到 SDR 的 tonemapping

    音频上这种玩意儿就叫 DRC ,完全是和 HDR 背道而驰
    podel
        8
    podel  
       2022-04-25 10:13:54 +08:00   ❤️ 1
    音频数据量很少。已经做到了理论无损了。不需要 HDR 。
    现在的视频数据量很大。就算是 HDR 也只是尽量还原现实。
    icyalala
        9
    icyalala  
       2022-04-25 10:17:11 +08:00
    从信号处理方面看,视频技术发展要比音频技术更困难,所以并不是 "音频技术发展远低于视频方面",而是音频技术发展更先接近那个极限,导致你感觉近些年音频没什么发展。
    imes
        10
    imes  
    OP
       2022-04-25 10:19:34 +08:00 via Android
    @ynyounuo 7# 感谢,我去研究研究
    delectate
        11
    delectate  
       2022-04-25 10:56:31 +08:00   ❤️ 1
    仅仅有双扬声器就够了吗,为什么说杜比全景声会让你更爽
    https://www.ifanr.com/1329834

    杜比全景声很强,但为啥以前没有 PC 音箱支持?
    https://36kr.com/p/1650364350101890
    arac
        12
    arac  
       2022-04-25 12:01:16 +08:00   ❤️ 3
    视频因为数据量巨大,早前流行的 8bit 其实只能记录 256 个亮度级别,对于人眼当然是远远不够的,所以采用 Gamma 曲线进行亮度映射。现在普通 HDR 视频提升到了 10bit ,Dolby Vision 12bit ,但其实仍然不够,所以依然会制定 HDR Gamma 曲线,压缩储存人眼不敏感亮度区域数据,视频依然没有达到理论无损。

    而几十年前 CD 对于响度就定下了的 16bit 标准,16bit 已经拥有 96dB 的响度动态范围,加上绝大多数的聆听环境都会有个几十 dB 的背景噪音,对于绝大多数场合和人群来说,16bit 的理论范围足够了。所以不是发展不够,是早已碾压。

    OP 说的技术几十年前就有了,只不过控制权都在创作者手里(好事),最近发展的全景声相当于 VR 一类技术了,是另外一个方向,不可直接和动态范围比较。

    解答:
    1. 目前音乐流媒体确实在做这样的事,把响度更高的歌曲播放音量降低。广播级别其实做这个事都几十年了,不过视频流媒体还很混乱。有兴趣可以去了解响度战争。
    2. 响度是声音表达和渲染的很重要一点,是创作者必须把握和利用好的,这个是创作者的权利。你这么做相当于限制画家只能用某个明度范围的颜料。
    你想要达到这个效果,可以直接在输出轨道上挂一个限制器,打高增益,相当于把悄悄话抬高,然后把输出打小,但是这样会让声音变得乏味无聊,很多制作差的电视剧就这么搞,声音非常难听聒噪缺乏细节。有兴趣可以去了解音频动态处理,压缩器,限制器。
    wanguorui123
        13
    wanguorui123  
       2022-04-25 12:21:32 +08:00
    真力有个空间补偿校正技术
    wanguorui123
        14
    wanguorui123  
       2022-04-25 12:22:27 +08:00
    @wanguorui123 GLM 校准
    idealhs
        15
    idealhs  
       2022-04-25 15:32:02 +08:00
    你弄错概念了,HDR 既然是影响中增强动态,音频中的动态增强就是无损音乐。有损音乐会将高频低频切掉的,无损就保留了。
    BingoXuan
        16
    BingoXuan  
       2022-04-25 15:52:14 +08:00
    你的耳朵宽容度太低,哪怕给你 32bit 的音频你也听不出和 18bit 区别
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   4514 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 10:05 · PVG 18:05 · LAX 03:05 · JFK 06:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.