FFmpeg 滤镜详解

news/2024/5/18 15:59:44/文章来源:https://blog.csdn.net/yinshipin007/article/details/128488198

FFmpeg Filter

1. 概念介绍

在多媒体处理中,术语滤镜(filter)指的是修改未编码的原始音视频数据帧的一种软件工具。

2. 基本原理

● 在编码前,ffmpeg可以对raw(真实/原)音频和视频使用libavfilter库中的滤镜进行处理。(非压缩数据帧) ● 多个滤镜可以组成滤镜链图(滤镜链图filtergraphs )。 ● 在ffmpeg看来只有2种滤镜:简单滤镜,复合滤镜。

2.1 简单滤镜

简单滤镜就是只有1个输入和输出的滤镜,滤镜两边的数据都是同一类型的,可以理解为在非压缩数据帧到再次编码前简单附加了一步:

2.2 复合滤镜

complex filtergraph,通常是具有多个输入输出文件,并有多条执行路径;ffmpeg命令行中使用-lavfi、-filter_complex,基本原理图如下:

2.3 原理示例

在libavfilter, 一个filter可以包含多个输入、多个输出。下图是一个filtergraph的示例:

在这个滤镜链图中,利用split滤镜把输入流分离成了两路流,其中一路通过crop滤镜和vfilp滤镜的同一路级联应用,再同另外一路一起通过overlay滤镜处理的流合成进行输出。则可以采用如下的命令行实现: 这个filtergraph可以用下面命令行表示: ffmpeg -i INPUT -vf "split main; [tmp] crop=iw:ih/2:0:0, vflip [flip]; main overlay=0:H/2" OUTPUT 这样最终输出将是视频上部是原始,下部是上部的镜像。(倒影效果) ffplay -i Irving_360p.mp4 -vf "split main; [tmp] crop=iw:ih/2:0:0, vflip [flip]; main overlay=0:H/2" 同一路的滤镜间用逗号(‘,’)进行分割,不同路的滤镜间用分号(‘;’)进行分割。

在这个例子里面crop和vflip是在同一路中的滤镜,split和overlay则不是同一路的(同一路的级联是对连续的视频进行,如果涉及到一输多、多输一或者多输多则都不是在同一路的,即不是同一路级联)。可以通过在方括号(’[]’)中的标签名来命名处理的链路。这个例子里,split滤镜生成了两路就通过[main]和[tmp]进行了标签命名以方便后续处理。 其中被split处理输出的第二路流被命名为[tmp],它又被crop滤镜处理裁去下半部视频,然后通过vflip进行了水平镜像(垂直翻转,即把视频镜像到下半部了)。这是整个输出被命名为flip。再把[main]与flip通过overlay进行覆盖合成,即把源输入通过split滤镜获得的[main]的上半部分覆盖到由crop和vflip滤镜级联处理的输出(这里的[flip])上最终得到了镜像结果。 一些滤镜支持参数列表: 滤镜名=由冒号(‘:’)隔开的多个参数

2.4 例子

比如视频缩放、截取、翻转、叠加、模糊等。其中定义了很多的filter,例如以下常用的一filter。 缩放 ffplay -i good.mp4 -vf scale=iw/2:ih/2 叠加 ffmpeg -i good_scale.mp4 -i mark.png -filter_complex overlay=main_w-overlay_w-10:main_h-overlay_h-10 good_mark.mp4 裁剪 ffplay -i good_scale.mp4 -vf crop=w=200:h=200:x=100:y=0 截取视频 ffmpeg -i good_scale.mp4 -vf trim=10:30 good_trim.mp4 模糊 ffplay -i good.mp4 -vf boxblur=luma_radius=2:luma_power=1 边缘检测 ffplay -i good_scale.mp4 -vf "edgedetect=low=0.1:high=0.4"

3. Filter的语法

一个滤镜链图(filtergraph)是连接滤镜的有向图。它可以包含循环动作,也可以在多个滤镜间形成链路,每个链接都有一个连接到滤镜的输入和一个连接到滤镜的输出。(参考)

滤镜链图采用文本表示,其有由一些ffmpeg和ffplay通用的选项-filter/-vf/-af和-filter_complex(ffmpeg)以及-vf/-af(ffplay)外加定义与libavfilter/avfilter.h的avfilter_graph_parse_ptr()等来描述。

(1)一个滤镜链包含序列链接起来的滤镜,这个序列由“,”分隔各个滤镜描述; (2)一个滤镜链图包含序列滤镜链,这个序列有“;”分隔各个滤镜链描述

一个滤镜由一个字符串表单表示: input_link_lable1... filter_name=parameters output_link_lable1...

(1) 输入输出都有连接标号(link lable),连接符号是可选项,在滤镜名和参数前 和 后 有一个连接标签列表。一个连接标签允许命名1个名字的连接,其作为滤镜的输入或者输出端口。 如果一个输出端没有命名标签,它默认连接到滤镜链上后面滤镜中第一个没有命名标签的输入端

(2) filter_name是滤镜类名字

(3) =arguments用于指定滤镜选项:参数表示法如下规则 (3.1)“:”分隔的key=value列表 举个例子:ffplay -i good.mp4 -vf scale=iw/2:ih/2 (3.2)一个“:”分隔的列表value值,在这种情况下,键(key)假定为选项名声明顺序 举个例子:ffplay -i good_scale.mp4 -vf fade=in:0:30(淡入视频的前30帧),按顺序声明了3个选项type、start_frame和nb_frames (3.3)上面两个规则混用 (3.4)如果选项的值本身就是一个列表(例如format滤镜有一个像素格式列表选项),则这种列表通常用“|”分隔 举个例子:将输入视频转换为列表中的任何格式 ffmpeg -i good_scale.mp4 -vf "format=pix_fmts=yuv420p|yuv444p|yuv410p" format.mp4

★文末名片可以免费领取音视频开发学习资料,内容包括(FFmpeg ,webRTC ,rtmp ,hls ,rtsp ,ffplay ,srs)以及音视频学习路线图等等。

见下方!↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓

 

4. 功能工具

4.1 工具graph2dot

FFmpeg工具目录下包含一个graph2dot程序可以用来分析滤镜链图描述并产生用dot语言描述的对应文本表示。 命令:dot -Tpng graph.tmp -o graph.png 描述文件:graph.tmp

生成图:

下载链接https://graphviz.org/download/

github的地址https://github.com/jrfonseca/gprof2dot.git

更多例子见附录的参考。

4.2 时间线编辑

一些滤镜支持常规的enable选项。对于支持时间线编辑的滤镜,这个选项可以被设置为一个表达式,其通过评估之前的情况来决定是否把帧画面发送给滤镜。

例如,要在1秒到20秒允许一个blur(模糊)滤镜(smartblur),然后curves滤镜在3秒之后: ffplay -i good_scale.mp4 -vf "smartblur=enable='between(t,1,20)',curves=enable='gte(t,3)':preset=cross_process"

4.3 实时更新Filter参数

在过滤器操作期间,可以使用命令更改某些选项。 这些选项在ffmpeg -h filter = <过滤器名称>的输出上标记为“ T”。命令的名称是选项的名称,参数是新值。

4.4 帧同步

一些具有多个输入的过滤器支持一组通用选项。 (1) eof_action(在secondary input上遇到EOF时采取的措施) repeat\endall\pass (2)shortest(如果设置为1,则在最短输入终止时强制输出终止。预设值为0。) (3)repeatlast(如果设置为1,则强制过滤器将辅助流的最后一帧扩展到主流的末尾。值为0禁用此行为。预设值为1。)

5. Filter命令详解

source filter(仅输出)、sink filter(仅输入)

5.1 命令分类

(1) audio filter

(1.1)Audio Base

(1.2)Audio Sources

(1.3)Audio Sinks (2) video filter

(2.1)Base Video Filters

(2.2)OpenCL Video Filters

(2.3)VAAPI Video Filters

(2.4)Video Sources

(2.5)Video Sinks

(3)Multimedia filter

(3.1)Multimedia

(3.2)Multimedia Sources

5.2 Audio Base(96)

8.1 acompressor (压缩器主要用于减小信号的动态范围,调整响度db)

8.2 acontrast (简单的音频动态范围压缩/扩展滤波器。) ps:音响的动态范bai围是指音响设备重放du时最大不失真输出功率与静态时系统zhi噪音输出功dao率之比的对数。单位为分贝(dB)。一般性能较好的音响系统的动态范围在100(dB)以上。

8.3 acopy (将输入音频源原样复制到输出。这主要用于测试目的。)

8.4 acrossfade(将交叉淡入淡出从一个输入音频流应用于另一输入音频流。交叉淡入淡出将在第一个流的结尾附近的指定持续时间内应用。) ffmpeg -i ca.mp3 -i see.mp3 -filter_complex acrossfade=d=10:c1=exp:c2=exp output.mp3

8.5 acrossover(将音频流分成几个频段。该滤波器将音频流分成两个或多个频率范围。) sub bass[20~65hz]这里是显示声音力量感的频段 Bass[65~250hz]定义声音肥瘦 节奏根音大都在在这个频段 提高250hz左右的频段可以在不影响清晰度的情况下给低频增加温暖感 中频[250~2000hz]决定了一个乐器有多突出 提升1000hz的频段可以给乐器增加质感 但这个频段过多使人感觉不适可能导致听觉疲劳 中高频[2000~6000hz]人耳对这个频段尤其敏感 即使提升很小的量 也会给声音造成质变 对这个频段需要小心处理 高频[6000~10000hz]这个频段可以听到一些刺耳的声音 提高这个频段可以增加明亮感 降低这个频段增加温暖感

8.6 acrusher(降低音频位分辨率。用于减少音频信号的采样位数。使声音柔和)

8.7 acue(延迟音频过滤,直到给定的墙上时钟时间戳。)

8.8 adeclick (消除输入音频中的脉冲噪声。)

8.9 adeclip (从输入音频中删除剪辑的样本。)

8.10 adelay (延迟一个或多个音频通道。) ffplay -i ca.mp3 -af "adelay=1500|0|500"

8.11 aderivative, aintegral (计算音频流的导数/积分。)

8.12 aecho (将回声应用于输入音频。) 更长的延迟听起来像山区的露天音乐会(输入增益:输出增益:延迟:衰变) ffplay -i ca.mp3 -af "aecho=0.8:0.9:1000:0.3"

8.13 aemphasis(音频强调过滤器可以创建或恢复直接从具有不同过滤器曲线的LP或重点CD中获取的素材。先通过滤波器更改信号,以消除该记录介质的缺点。)

8.14 aeval(根据指定的表达式修改音频信号。) 采样率、输入输出通道数、音量等 ffplay -i ca.mp3 -af "aeval=val(ch)/5:c=same"(音量减小到1/5)

8.15 afade(将淡入/淡出效果应用于输入音频。) ffplay -i ca.mp3 -af "afade=t=in:ss=0:d=15" (淡入15秒)

8.16 afftdn(使用FFT对音频样本进行除噪。)

8.17 afftfilt(将任意表达式应用于频域中的样本) 在音频中几乎只保留低频 ffplay -i ca.mp3 -af afftfilt="'real=re * (1-clip((b/nb)b,0,1))':imag='im * (1-clip((b/nb)b,0,1))'"

8.18 afir (应用任意的有限冲激响应滤波器。可用作数字分频器滤波器,房间均衡,串扰消除,波场合成,听觉化,歧义,歧义和空间化的组件。)

8.19 aformat (设置输入音频的输出格式约束。该框架将协商最合适的格式以最大程度地减少转化。)

8.20 agate(门控主要用于减少信号的过低。这种信号处理可减少有用信号之间的干扰噪声。)

8.21 aiir(应用任意的无限冲激响应滤波器。) 在5000Hz左右施加2极椭圆形陷波,采样率为48000 Hz ffplay -i ca.mp3 -af "aiir=k=1:z=7.957584807809675810E-1 -2.575128568908332300 3.674839853930788710 -2.57512875289799137 7.957586296317130880E-1:p=1 -2.86950072432325953 3.63022088054647218 -2.28075678147272232 6.361362326477423500E-1:f=tf:r=d"

8.22 alimiter(限幅器可防止输入信号超过所需的阈值。)

8.23 allpass(全通滤波器可更改音频的频率与相位关系,而不会更改其频率与振幅关系。)

8.24 aloop (循环音频样本。)

8.25 amerge(将两个或多个音频流合并为一个多通道流。)

8.26 amix(将多个音频输入混合为一个输出。)

8.27 amultiply(将第一音频流与第二音频流相乘,并将结果存储在输出音频流中。通过将来自第一流的每个样本与来自第二流的相同位置的样本相乘来完成乘法。)

8.28 anequalizer(每个通道的高阶参数多频带均衡器。)

8.29 anlmdn(使用非本地均值算法减少音频样本中的宽带噪声。)

8.30 anlms(使用第二个音频流将标准化的最小均方算法应用于第一个音频流。)

8.31 anull(将未更改的音频源传递到输出。)

8.32 apad(用静音填充音频流的结尾。)

8.33 aphaser(向输入音频添加定相效果。)

8.34 apulsator(音频脉冲发生器介于自动调音台和颤音之间。但是它也可以产生有趣的立体声效果。)

8.35 aresample(使用libswresample库将输入音频重新采样为指定的参数。使用libswresample库将输入音频重新采样为指定的参数。) ffplay -i ca.mp3 -af aresample=44100

8.36 areverse(反转音频剪辑。)

8.37 arnndn(使用递归神经网络减少语音噪声。需要模型文件) 8.38 asetnsamples(设置每个输出音频帧的样本数。)

8.39 asetrate(在不更改PCM数据的情况下设置采样率。这将导致速度和螺距的变化。)

8.40 ashowinfo(显示一行,其中包含每个输入音频帧的各种信息。输入音频未修改。)

8.41 asoftclip(应用音频软剪辑。)

8.42 asr(自动语音识别,需要模型)

8.43 astats(显示有关音频通道的时域统计信息。计算并显示每个音频通道的统计信息,并在适用的情况下还提供总体数字。)

8.44 asubboost(提高低音炮频率。)

8.45 atempo(调整音频速度。) ffplay -i ca.mp3 -af atempo=3

8.46 atrim(修剪输入,以便输出包含输入的一个连续子部分。) 删除除输入第二分钟外的所有内容 ffmpeg -i INPUT -af atrim=60:120 ffmpeg -i ca.mp3 -af atrim=5:30 ca_trim.mp3

8.47 axcorrelate(计算两个输入音频流之间的归一化互相关。)

8.48 bandpass

8.49 bandreject

8.50 bass, lowshelf(使用两极置物架滤波器来增强或削减音频的低音(较低)频率,其响应类似于标准高保真音调控制。这也称为搁架均衡(EQ)。)

8.51 biquad(应用具有给定系数的双二阶IIR滤波器。)

8.52 bs2b(鲍尔(Bauer)立体声转换为双耳,可改善立体声音频记录的耳机收听效果。)

8.53 channelmap(将输入通道重新映射到新位置。)

8.54 channelsplit(将每个通道从输入音频流拆分为单独的输出流。)

8.55 chorus(向音频添加合唱效果。) 具有三个延迟的更丰富的合唱: ffplay -i ca.mp3 -af "chorus=0.5:0.9:50|60|40:0.4|0.32|0.3:0.25|0.4|0.3:2|2.3|1.3"

8.56 compand(压缩或扩展音频的动态范围。) 使音乐既安静又响亮,适合在嘈杂的环境中收听 ffplay -i ca.mp3 -af "compand=.3|.3:1|1:-90/-60|-60/-40|-40/-30|-20/-20:6:0:-90:0.2"

8.57 compensationdelay(补偿延迟线是基于度量的延迟,用于补偿麦克风或扬声器的不同位置。)

8.58 crossfeed(应用耳机交叉馈电过滤器。)

8.59 crystalizer(扩展音频动态范围的简单算法。)

8.60 dcshift(对音频应用直流偏移。)

8.61 deesser(测对音频样本进行de-essing处理。)

8.62 drmeter(测量音频动态范围。)

8.63 dynaudnorm(动态音频规范化器。)

8.64 earwax(使音频更易于在耳机上收听。)

8.65 equalizer(应用两极峰均化(EQ)滤波器。)

8.66 extrastereo(线性增加左右声道之间的差异,从而在播放中增加某种“实时”效果)

8.67 firequalizer(使用任意频率响应进行FOR均衡。)

8.68 flanger(对音频应用镶边效果。)

8.69 haas(将哈斯效果应用于音频。)

8.70 hdcd(解码高清兼容数字(HDCD)数据。具有嵌入式HDCD代码的16位PCM流被扩展为20位PCM流)

8.71 headphone

8.72 highpass

8.73 join(将多个输入流合并为一个多通道流。)

8.74 ladspa(加载LADSPA(Linux音频开发人员的简单插件API)插件。要启用此过滤器的编译,您需要使用--enable-ladspa配置FFmpeg。)

8.75 loudnorm

8.76 lowpass(应用点频为3dB的低通滤波器。)

8.77 lv2 8.78 mcompand

8.79 pan

8.80 replaygain

8.81 resample

8.82 rubberband

8.83 sidechaincompress

8.84 sidechaingate

8.85 silencedetect(检测音频流中的静音。)

8.86 silenceremove(消除音频开头,中间或结尾的静音。)

8.87 sofalizer

8.88 stereotools

8.89 stereowiden

8.90 superequalizer

8.91 surround

8.92 treble, highshelf

8.93 tremolo

8.94 vibrato

8.95 volume(调整输入音频音量。)

8.96 volumedetect(检测输入视频的音量。)

stereo双声道、mono单声道

5.3 Audio Sources(输出9)

9.1 abuffer(缓冲音频帧,并使它们可用于过滤器链。该资源主要用于编程用途,尤其是通过libavfilter / buffersrc.h中定义的接口。) 9.2 aevalsrc(生成表达式指定的音频信号。) 生成频率为440 Hz的正弦信号,将采样率设置为8000 Hz ffplay -f lavfi aevalsrc="sin(4402PI*t):s=8000" 产生白噪声 aevalsrc="-2+random(0)" 9.3 afirsrc(使用频率采样方法生成FIR系数。) 9.4 anullsrc(空音频源,返回未处理的音频帧。它主要用作模板并在分析/调试工具中使用,或用作忽略输入数据的过滤器(例如sox合成过滤器)的来源。) 9.5 flite(使用libflite库合成语音。要启用此过滤器的编译,您需要使用--enable-libflite配置FFmpeg。) 9.6 anoisesrc(产生噪音音频信号。) ffplay -f lavfi anoisesrc=d=60:c=pink:r=44100:a=0.5 9.7 hilbert(生成奇抽头希尔伯特变换FIR系数。) 9.8 sinc(生成Sinc Kaiser窗式低通,高通,带通或带阻FIR系数。) 9.9 sine(生成由振幅为1/8的正弦波组成的音频信号。)

5.4 Audio Sink(输入2)

10.1 abuffersink(缓冲音频帧,并使它们可用于过滤器链的末尾。该接收器主要用于编程用途,尤其是通过libavfilter / buffersink.h或选项系统中定义的接口。) 10.2 anullsink(空音频接收器;输入音频绝对不做任何事情。它主要用作模板并用于分析/调试工具。)

5.5 单输入音频过滤处理流程

音频解码后,可以avfilter api对解码出来的AVFrame进行效果处理,如音量调节,变速处理。多个音频输入还可以进行混音处理单输入过滤器解码流程 解码出

AVFrame -> abuffer-> 其他过滤器(volume)...->aformat->abuffersink->过滤后的AVFrame

这里看到有三个通用的过滤器,abuffer,aformat,abuffersink。abuffer用于接收输入frame,形成待处理的数据缓存,abuffersink用于传出输出Frame,aformat过滤器约束最终的输出格式(采样率,声道数,存储位数等),这三个不可缺少。而中间的其他过滤器可以串联多个filter,如volume,atempo

5.6 Base Video Filters(245)

比如视频缩放、截取、翻转、叠加、模糊等。其中定义了很多的filter,例如以下常用的一filter。

  • scale:视频/图像的缩放(libswscale, 强制原输入的高宽比)(https://ffmpeg.org/ffmpeg-filters.html#scale-1)

(1)ffplay -i good.mp4 -vf scale=640:360

(2)ffplay -i good.mp4 -vf scale=iw/2:ih/2

(3)ffmpeg -i mark.png -vf scale=iw2:ih2 mark_scale.png

  • overlay:视频/图像的叠加(https://ffmpeg.org/ffmpeg-filters.html#overlay-1)

  1. ffmpeg -i good_scale.mp4 -i mark.png -filter_complex overlay good_mark.mp4

  2. ffmpeg -i good_scale.mp4 -i mark.png -filter_complex overlay=main_w-overlay_w-10:main_h-overlay_h-10 good_mark.mp4

  • crop:视频/图像的裁剪(https://ffmpeg.org/ffmpeg-filters.html#crop)

  1. 裁剪尺寸为200x200的中央输入区域

ffplay -i good_scale.mp4 -vf crop=200:200

  1. 裁剪长宽200x200,位置(100,0)左上角起始

ffplay -i good_scale.mp4 -vf crop=w=200:h=200:x=100:y=0

  1. 从左右边界裁剪10个像素,从上下边界裁剪20个像素

ffplay -i good_scale.mp4 -vf crop=in_w-210:in_h-220

  1. 应用颤抖效果

ffplay -i good_scale.mp4 -vf "crop=in_w/2:in_h/2:(in_w-out_w)/2+((in_w-out_w)/2)sin(n/10):(in_h-out_h)/2 +((in_h-out_h)/2)sin(n/7)"

  • trim:截取视频的片段(https://ffmpeg.org/ffmpeg-filters.html#trim)

  1. 截取视频10s到30s的内容,这里音频还在

ffmpeg -i good_scale.mp4 -vf trim=10:30 good_trim.mp4

  • rotate:以任意角度旋转视频(https://ffmpeg.org/ffmpeg-filters.html#rotate)

(1)顺时针旋转输入PI / 6弧度

ffplay -i good_scale.mp4 -vf rotate=PI/6

(2)从PI / 3的角度开始,以周期T进行恒定旋转(T=10就是10s)

ffplay -i good_scale.mp4 -vf "rotate=PI/3+2PIt/T:fillcolor = red"

(3)使输入视频旋转以T秒的周期和A弧度的幅度振荡(A = 5, T = 10)

ffplay -i good_scale.mp4 -vf rotate=Asin(2PI/T*t)

  • 左右翻转(https://ffmpeg.org/ffmpeg-filters.html#hflip)

ffplay -i Irving_360p.mp4 -vf "crop=iw/2:ih:0:0,splitleft;[tmp]hflip[right];left hstack"

  • 上下翻转(https://ffmpeg.org/ffmpeg-filters.html#vflip)

ffplay -i Irving_360p.mp4 -vf "split main; [tmp] crop=iw:ih/2:0:0, vflip [flip]; main overlay=0:H/2"

  • 模糊(https://ffmpeg.org/ffmpeg-filters.html#boxblur)

ffplay -i good.mp4 -vf boxblur=luma_radius=2:luma_power=1

  • colorchannelmixer 可以设置rgba四个分量的变换关系,共接受16个参数

rrrgrbragrgggbgabrbgbbbaaragabaa

参数本质就是加权求值时候的权重,每个参数接受0-1得值,滤镜本

质是将每个颜色值加权求值.公式:red=redrr+bluerb+greenrg+alphara 。green/blue和alpha同理。参数默认值对应得是1,其他为0.如:rr,rg,rb,ra。其中rr默认为1,其他为0。

ffplay -i good_scale.mp4 -vf "colorchannelmixer=.3:.4:.3:0:.3:.4:.3:0:.3:.4:.3"

之所以会是灰阶效果,原因是将每个颜色分量相等,所以rgb混合后为透明度不同得黑色

褐色处理:

ffplay -i good_scale.mp4 -vf "colorchannelmixer=.393:.769:.189:0:.349:.686:.168:0:.272:.534:.131"

  • edgedetect 边缘检测

感觉这个最好还是当作中间操作来用,因为单纯过这个滤镜并不会有什么美感,但是边缘检测却是实现其他操作的必经之路,比如:油画效果,动画片效果等等。

ffplay -i good_scale.mp4 -vf "edgedetect=low=0.1:high=0.4"

添加油画效果

ffplay -i good_scale.mp4 -vf "edgedetect=mode=colormix:high=0"

  • geq 功能特别强大,因为它不仅仅因为它接受的参数众多,而且表达式也很多,所以可以动态的设置很多东西,甚至可以跟播放进度产生关系,进而达到视频闪烁的效果。

根据像素位置修改RGB分量

ffplay -i good_scale.mp4 -vf "geq=r='X/Wr(X,Y)':g='(1-X/W)g(X,Y)':b='(H-Y)/H*b(X,Y)'"

5.7 OpenCL Video Filters(17)

要启用这些过滤器的编译,需要使用--enable-opencl配置FFmpeg。运行OpenCL筛选器要求您初始化硬件设备,并将该设备传递给任何筛选器图中的所有筛选器。

由于OpenCL过滤器无法访问普通内存中的帧数据,因此所有帧数据需要先上传(hwupload)到连接到适当设备的硬件表面,然后再使用,然后再下载(hwdownload)回到普通存储器。请注意,hwupload将以与软件框架相同的布局上载到表面,因此可能有必要在将输入转换为正确格式之前立即添加格式过滤器,并且hwdownload不支持输出中的所有格式-这可能必须在图表后立即插入一个附加的格式过滤器,以获取受支持格式的输出。

12.1 avgblur_opencl

12.2 boxblur_opencl

12.3 colorkey_opencl(RGB色彩空间颜色键控。)

12.4 convolution_opencl(应用3x3、5x5、7x7矩阵的卷积)

12.5 erosion_opencl(对视频应用腐蚀效果。)

12.6 deshake_opencl(基于特征点的视频稳定滤波器。防抖)

12.7 dilation_opencl(将膨胀效果应用于视频。)

12.8 nlmeans_opencl(通过OpenCL的非本地均值降噪过滤器)

12.9 overlay_opencl(将一个视频叠加在另一个视频上。)

12.10 pad_opencl(将填充物添加到输入图像,并将原始输入放置在提供的x,y坐标处。)

12.11 prewitt_opencl

12.12 program_opencl(使用OpenCL程序过滤视频。)

12.13 roberts_opencl

12.14 sobel_opencl(应用Sobel运算符,边缘检测用的算子)

12.15 tonemap_opencl(通过色调映射执行HDR(PQ / HLG)到SDR的转换。)

12.16 unsharp_opencl(锐化或模糊输入视频。)

12.17 xfade_opencl(使用OpenCL交叉淡化具有自定义过渡效果的两个视频。)

5.8 VAAPI Video Filters(Video Acceleration API) 针对Intel CPU X86架构平台,可采用FFmpeg+VAAPI的硬解方案。其中,FFmpeg用于处理各种格式的视频解码;VAAPI则提供对硬件加速视频处理的访问,处理流程图如下。

image VAAPI视频过滤器通常与VAAPI解码器和VAAPI编码器一起使用。以下是VAAPI视频过滤器的说明。要启用这些过滤器的编译,您需要使用--enable-vaapi配置FFmpeg

5.9 Video Sources(10)

(1)cellauto 创建由基本元胞自动机生成的模式。 ffplay -f lavfi -i cellauto=ratio=2/3:s=200x200 (2)mptestsrc 生成由MPlayer测试过滤器生成的各种测试模式。 ffplay -f lavfi -i mptestsrc=t=dc_luma (3)life 生成细胞动态模式。 ffplay -f lavfi -i life=s=300x200:mold=10:r=60:ratio=0.1:death_color=#C83232:life_color=#00ff00,scale=1200:800:flags=16

5.10 Multimedia Filter(30)

用于音频转为视频的显示(频率等),

16.1 abitscope(将输入音频转换为视频输出,显示音频位范围。)

16.2 adrawgraph(使用输入的音频元数据绘制图形。)

16.3 agraphmonitor

16.4 ahistogram(将输入音频转换为视频输出,显示音量直方图。)

16.5 aphasemeter(测量输入音频的相位,将其导出为元数据l)

16.6 avectorscope(将输入音频转换为视频输出,代表音频矢量范围。) ffplay -f lavfi "amovie=ca.mp3, asplit a; [a] avectorscope=zoom=1.3:rc=2:gc=200:bc=10:rf=1:gf=8:bf=7 [out0]"

16.7 bench, abench(筛选器的基准部分。)

16.8 concat(连接音频和视频流,一个接一个地将它们连接在一起。该过滤器适用于同步视频和音频流的片段。所有段的每种类型必须具有相同数量的流,并且这也将是输出中的流数量。)

16.9 ebur128

16.10 interleave, ainterleave(临时交错来自多个输入的帧。)

16.11 metadata, ametadata

16.12 perms, aperms

16.13 realtime, arealtime

16.14 select, aselect(选择要传递的帧。)

16.15 sendcmd, asendcmd

16.16 setpts, asetpts(更改输入帧的PTS(演示时间戳记)。)

16.17 setrange

16.18 settb, asettb

16.19 showcqt(将输入音频转换为代表频谱的视频输出) ffplay -f lavfi "amovie=ca.mp3, asplit a; [a] showcqt [out0]" ffplay -f lavfi "aevalsrc=0.1sin(2PI55t)+0.1sin(4PI55t)+0.1sin(6PI55t)+0.1sin(8PI55t),asplita; [a] showcqt [out0]"

16.20 showfreqs(将输入音频转换为代表音频功率谱的视频输出)

16.21 showspatial(将立体声输入音频转换为视频输出,以表示两个通道之间的空间关系。)

16.22 showspectrum 将输入音频转换为代表音频频谱的视频输出。 ffplay -f lavfi "amovie=ca.mp3, asplit a; [a] showspectrum=mode=separate:color=intensity:slide=1:scale=cbrt [out0]"

16.23 showspectrumpic

16.24 showvolume(将输入音频音量转换为视频输出。)

16.25 showwaves

16.26 showwavespic

16.27 sidedata, asidedata

16.28 spectrumsynth

16.29 split, asplit(将输入音频音量转换为视频输出。split使用音频输入,使用视频分割。)

16.30 zmq, azmq

5.11 Multimedia Source

movie/amovie 从movie容器中读取音频和/或视频流。

6. 水印、截图、人物滤镜等常用命令

(1) 水印 overlaye ffmpeg -i good_scale.mp4 -i mark.png -filter_complex overlay=10:10 good_mark.mp4

(2) 人物滤镜 colorchannelmixer

(3) 截取视频片段 copy ffmpeg -ss 5 -i input.mp4 -t 10 -c:v copy -c:a copy output.mp4 //-ss 5指定从输入视频第5秒开始截取,-t 10指明最多截取10秒。

(4) 把视频文件推送到rtmp服务器(ffmpeg -re -i jack.mp4 -c copy -f flv rtmp://host/live/test)

(5) 分离/合并视频音频流 (copy) ffmpeg -i input-video -vn -c:a copy output-audio //分离音频流 ffmpeg -i input-video -c:v copy -an output-video //分离视频流 ffmpeg -i input-video -c:v copy -an output-video -c:a -vn output-audio //同时分离音频和视频流 ffmpeg -i video_file -i audio_file -c:v copy -c:a copy output_file //合并视频音频流

(6) 视频截图 ffmpeg -ss 01:23:45 -i input -vframes 1 -q:v 2 output.jpg

(7) 图片序列与视频的互相转换 ffmpeg -i %04d.jpg output.mp4 ffmpeg -i input.mp4 %04d.jpg \第一行命令是把0001.jpg、0002.jpg、0003.jpg等编码成output.mp4, \第二行则是相反把input.mp4变成0001.jpg……。 \%04d.jpg表示从1开始用0补全的4位整数为文件名的jpg文件序列。

(8) 视频中去水印delogo ffmpeg -i good_mark.mp4 -vf delogo=x=10:y=10:w=100:h=60 delogo.mp4 (ffmpeg -i good_scale.mp4 -i mark.png -filter_complex overlay=10:10 good_mark.mp4 加水印)

6. 参考文章

[1]. http://ffmpeg.org/ffmpeg.html#Filtering

[2]. https://ffmpeg.org/ffmpeg-filters.html

[3]. https://www.bookstack.cn/read/other-doc-cn-ffmpeg/ffmpeg-doc-cn-30.md

[4]. FFmpeg filter的使用介绍

[5]. https://www.bogotobogo.com/FFMpeg/ffmpeg_image_scaling_jpeg.php

[6]. 使用gprof2dot和graphivz生成程序运行调用图

[7]. Graphviz 画图和例子

[8]. Graphviz典型例子

[9]. https://restream.io/blog/what-is-low-latency/

[10]2020 FFmpeg 滤镜详解 - 简书

作者:DoubleLi

★文末名片可以免费领取音视频开发学习资料,内容包括(FFmpeg ,webRTC ,rtmp ,hls ,rtsp ,ffplay ,srs)以及音视频学习路线图等等。

见下方!↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_241626.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何设计一个好的工业产品?

许多人不知道工业设计的本质是什么?与工业设计相比&#xff0c;其本质是解决消费群体的相关问题&#xff0c;实现消费者的需求&#xff0c;使客户更容易选择。但是如何设计一个好的工业产品呢? 1.更加科学合理地摆脱困境 产品设计必须开拓进取。它应该能够引领时代潮流&#…

flink内存管理, 增加Task内存大小,减少ManageMemory, network内存的方法

问题描述 flink默认分配的内存&#xff0c;不合理&#xff0c;jvm 堆内存太小&#xff0c;其他内存太大。向yarn申请8G内存&#xff0c;最后分配到heap的大小才3.2G&#xff0c;不是让人抓狂吗&#xff1f; 以上是&#xff0c;向yarn申请8G内存&#xff0c;实时分配的内存是上…

UE4 音效总结

最近撸了一下音效&#xff0c;做个总结Mark一下&#xff1a; 1.Cue文件&#xff1a;音频序列化文件&#xff0c;能够对多个音频文件进行排序、组合、淡入淡出等操作&#xff0c;做出新的音频文件 2.Cue文件中的“声音节点” 2.1按参数交叉淡化&#xff1a; 节点及参数详解&…

Java语法五:锁策略以及CAS

目录 1.常见的锁策略 2&#xff1a;Synchronized原理 2.1&#xff1a;加锁工作工程 2.2:其他的优化操作 2.2.1&#xff1a;锁消除 2.2.2&#xff1a;锁粗化 3.CAS 3.1&#xff1a;实现原子类 3.2&#xff1a;CAS中的ABA问题 3.2.1&#xff1a;什么是ABA问题 3.2.2&am…

ubantu 配置及解决问题

1、安装GCC出现等待缓存锁 需要将其冲突的删除&#xff0c;利用下面三个代码后重新输入下载即可。 sudo rm /var/lib/dpkg/lock-frontend sudo rm /var/cache/apt/archives/lock sudo rm /var/lib/dpkg/lock2、开启共享文件夹&#xff1a; 参考以下链接&#xff0c;在进行的…

【store商城项目05】新增收获地址的开发

新增收获地址的开发1.创建地址表2.创建实体类3.持久层的开发3.1规划需要执行的SQL语句3.2Mapper接口与抽象方法3.3配置SQL映射3.4测试4.业务层的开发4.1规划异常4.2接口和抽象方法4.3实现抽象方法4.4测试5.控制层的开发5.1规划异常5.2设计请求5.3处理请求5.4测试6前端页面1.创建…

队列------数据结构

队列:Queue是一个普通的队列&#xff0c;Deque是一个双端队列 普通的队列:只能是队尾进&#xff0c;队头出; 双端队列:可以从队头进队尾出&#xff0c;也可以从队尾进&#xff0c;队头出&#xff0c;也可以用作一个栈; 1)下面我们来介绍一下Queue的实现方法: 在有容量限制的情况…

教育行业回访话术

近些年来&#xff0c;随着知识经济的快速发展&#xff0c;教育市场呈现良好的增长态势。越来越多的人开始通过参加各种培训来提升自己&#xff0c;教育行业竞争十分激烈。 前言 近些年来&#xff0c;随着知识经济的快速发展&#xff0c;教育市场呈现良好的增长态势。而且由于受…

React Native windows环境搭建

1.首先准备下载必须的依赖&#xff1a;Node、JDK 、Android Studio、夜神模拟器 ①Node可以直接到 官网 下载&#xff0c;版本必须大于14&#xff0c;我这边用的是v16.15.1 ②Jave JDK&#xff0c;我直接在360软件管家安装的&#xff0c;搜的是JDK 11&#xff0c;React Nativ…

mysql 存储过程实现从一张表数据迁移到另一种表

通过存储过程迁移数据&#xff1a; 创建表 CREATE TABLE test1 ( idp varchar(255) DEFAULT NULL, brandIdp varchar(255) DEFAULT NULL, namep varchar(1000) DEFAULT NULL, urlp varchar(1000) DEFAULT NULL ) ENGINEInnoDB DEFAULT CHARSETkeybcs2; INSERT INTO t…

vue element-ui 手机号校验 验证码校验 获取验证码倒数60秒无样式实现

这段时间被迫搞前端搞裂开了&#xff0c;记录一下手机号验证码校验登录的极简无样式前端实现 巨丑&#xff01;希望大佬们不介意 下面是先演示效果 点击登陆后显示校验信息 输入手机号点击获取验证码 输入符合校验的内容后点击登录提示成功 无后端交互&#xff01;&#…

2-2-3-10、并发设计模式

目录终止线程的设计模式Two-phase Termination&#xff08;两阶段终止&#xff09;模式——优雅的终止线程使用场景避免共享的设计模式Immutability模式——想破坏也破坏不了如何实现使用 Immutability 模式的注意事项Copy-on-Write模式应用场景Thread-Specific Storage 模式—…

企业电子招标采购系统源码及功能清单

​ ​ 一、立项管理 1、招标立项申请 功能点&#xff1a;招标类项目立项申请入口&#xff0c;用户可以保存为草稿&#xff0c;提交。 2、非招标立项申请 功能点&#xff1a;非招标立项申请入口、用户可以保存为草稿、提交。 3、采购立项列表 功能点&#xff1a;对草稿进行编…

Android 音视频编解码(三) -- 视频编码和H264格式原理讲解

Android 音视频编解码(一) – MediaCodec 初探 Android 音视频编解码(二) – MediaCodec 解码(同步和异步) 前面学习了 MediaCodec 的基本原理&#xff0c;以及如何解码&#xff0c;在学习MediaCodec 编码之前&#xff0c;先来学习视频是如何编码的&#xff0c;以及最常用的 H2…

用纯python脚本玩转UU加速器

1. 前言 之前几期内容&#xff0c;我们出过纯py形式的Android自动化脚本。同学们一直让再出一下纯py形式的Windows脚本&#xff0c;今天我们以UU加速器为例&#xff0c;给大家出一个简单的学习demo。 2. UU加速器的自动化demo 今天的练习demo也非常简单&#xff0c;大致内容…

JMeter操作笔记

通过这个图&#xff0c;我们可以看到一个简单的计算逻辑&#xff1a; 1. 如果有 10000 个在线用户数&#xff0c;同时并发度是 1%&#xff0c;那显然并发用户数就是 100。 2. 如果每个线程的 20TPS&#xff0c;显然只需要 5 个线程就够了&#xff08;请注意&#xff0c;这里…

存储控制器

存储控制器是按照一定的时序规则对存储器的访问进行必要控制的设备&#xff0c;包括地址信号、数据信号以及各种命令信号的控制&#xff0c;使主设备(访问存储器的设备)能够根据自己的要求使用存储器上的存储资源。 存储控制器的作用主要就是进行接口的转换&#xff0c;将主设…

剑指 Offer 17. 打印从1到最大的n位数

题目 输入数字 n&#xff0c;按顺序打印出从 1 到最大的 n 位十进制数。比如输入 3&#xff0c;则打印出 1、2、3 一直到最大的 3 位数 999。 思路 本题应该考虑的是大数问题&#xff0c;但是返回数组为int[]。。。所以两种方法都做一下 方法一&#xff1a;普通解法&#xff…

【JavaEE】Linux

努力经营当下&#xff0c;直至未来明朗&#xff01; 文章目录一、Linux概述二、 云服务器安装Linux环境 Xshell登录三、Linux中常用指令介绍1. ls2. pwd 查看当前路径对应的绝对路径3. cd 切换当前的工作目录4. touch&#xff1a;创建一个空文件5. cat&#xff1a; 显示文件内…

java中的static修饰符笔记

static&#xff1a;静态的 静态变量&#xff1a; 由static修饰属于类&#xff0c;存储在方法区中&#xff0c;只有一份常常通过类名点来访问何时用&#xff1a;所有对象所共享的数据(图片、音频、视频等) class Loo{int a;static int b;Loo(){a;b;}void show(){System.out.pr…