blog.monophile.net

コンピュータのこととかのメモ。

山本 一彰 | Takaaki Yamamoto

東京工業大学において計算機科学と応用数学を学び、 情報科学芸術大学院大学[IAMAS]においてメディア表現を専攻し修了。 2015年にコンビネータ論理を基に計算完備な計算手法 "論理珠算"を開発し、 それを含む体系である"算道"を構成した。 その成果により、2016年に第19回 文化庁メディア芸術祭 アート部門 新人賞 (文部科学大臣賞)を受賞。 現在はUzabase, Inc.において、SPEEDA事業部のSREとして生計をたててている。

技術

Configuration Management Ansible, Cloud-Init, Terraform
Cloud Platform GCP, AWS, Azure, OpenStack
Virtualization, Container QEMU+KVM, Proxmox, Xen, LXD/LXC, Docker, systemd-nspawn
OS, Distribution Ubuntu, Debian GNU/Linux, CentOS, FreeBSD, ...
Storage Ceph, GlusterFS, ZFS, Btrfs, ...
Router Linux+Netfilter, Quagga, VyOS, Cisco IOS, YAMAHA RTX, ...
Switch Dell FTOS, AlaxalA, NETGEAR, ...
SQL MySQL, MariaDB(Galera Cluster), PostgreSQL, BigQuery, ...
NoSQL MongoDB, Elasticsearch, InfluxDB, etcd, ...
Mail postfix, dovecot, RainLoop
WebApps WordPress, GitLab, MatterMost, Redmine, ...
Monitoring Prometheus, Grafana, Nagios, Munin, Zabbix
DNS CoreDNS, dnsmasq, unbound, BIND9, ...
Misc Kubernetes/Istio, certbot, ...

自称はネットワークエンジニアだが、Linuxのネットワークと仮想化技術が得意なため、 サーバエンジニアの雰囲気のほうが強いかもしれない。

習得中

Virtualization, Container, OS MAAS, rkt, Container Linux, ...
Network NFV, mVPN, Calico, IoT(6LoWPAN, LoRaWAN), ...
NoSQL CouchDB, Redis, ...
Misc Test Engineering, ...

投稿

ffmpegとSoXで音源の特性を調べる

いきさつ

マスタリングの音圧に関しての記事 http://pspunch.com/pd/article/loudness/ を読んで、LUFSってどうやったら調べられるんだろう、と思ってやってみた。

SoXを使う

# install

MacPortsを使ってffmpegとSoXをインストールします。

$ sudo port install ffmpeg sox

音源の特性

以下のコマンドでtest.wavの特性が分かります。 statsの場合はLeft-Rightチャネルを別々に解析し、statの場合はモノラルでの計測になります。

$ sox test.wav -n -S stats

すると以下の様な出力を得ます。

Input File     : 'test.wav'
Channels       : 2
Sample Rate    : 44100
Precision      : 16-bit
Duration       : 00:04:17.88 = 11372508 samples = 19341 CDDA sectors
File Size      : 45.5M
Bit Rate       : 1.41M
Sample Encoding: 16-bit Signed Integer PCM

In:100%  00:04:17.88 [00:00:00.00] Out:11.4M [!=====|=====!] Hd:0.4 Clip:0
             Overall     Left      Right
DC offset   0.000038  0.000038  0.000027
Min level  -0.946869 -0.946106 -0.946869
Max level   0.946777  0.942383  0.946777
Pk lev dB      -0.47     -0.48     -0.47
RMS lev dB    -12.09    -12.49    -11.73
RMS Pk dB      -6.97     -7.70     -6.97
RMS Tr dB       -inf      -inf      -inf
Crest factor       -      3.98      3.65
Flat factor     0.00      0.00      0.00
Pk count           2         2         2
Bit-depth      16/16     16/16     16/16
Num samples    11.4M
Length s     257.880
Scale max   1.000000
Window s       0.050
Done.

動画の音声の特性

ffmpegを用いれば動画の音声についても同様に調べることができます。

$ ffmpeg -v quiet -ac 2 -channel_layout stereo -i test.mov -f sox - | sox -t sox - -n stats

音源のLUFS

ffmpegを用いてLUFSを調べることができます。

$ ffmpeg -nostats -ac 2 -channel_layout stereo -vn -i test.wav -filter_complex ebur128 -f null -

すると結果が標準出力に書かれて、I:の項が全体のLUFSの値になっています。

 :
 :
 :
  Integrated loudness:
    I:          -9.3 LUFS
    Threshold: -19.4 LUFS

  Loudness range:
    LRA:         4.4 LU
    Threshold: -29.4 LUFS
    LRA low:   -11.6 LUFS
    LRA high:   -7.2 LUFS

reference