当前位置: 代码迷 >> 综合 >> 【网络通信 -- 直播】视频流编码 -- libx264 结构体 x264_param_t 说明与码率控制
  详细解决方案

【网络通信 -- 直播】视频流编码 -- libx264 结构体 x264_param_t 说明与码率控制

热度:26   发布时间:2024-03-08 12:33:43.0

【网络通信 -- 直播】视频流编码 -- libx264 结构体 x264_param_t 说明与码率控制

【1】libx264 结构体 x264_param_t 详解

/* 结构体x264_param_t定义在x264.h中 */
typedef struct x264_param_t
{/* CPU 标志位 */unsigned int cpu;int  i_threads;                 // 并行编码多帧; 线程数,为0则自动多线程编码int  b_sliced_threads;          // 如果为false,则一个slice只编码成一个NALU;// 否则有几个线程,在编码成几个NALU。缺省为true。int  b_deterministic;           // 是否允许非确定性时线程优化int  b_cpu_independent;         // 强制采用典型行为,而不是采用独立于cpu的优化算法int  i_sync_lookahead;          // 线程超前缓存帧数/* 视频属性 */int  i_width; // 视频图像的宽int  i_height; // 视频图像的高int  i_csp;          // 编码比特流的CSP,仅支持i420,色彩空间设置int  i_level_idc; // 指明作用的level值,可能与编码复杂度有关int  i_frame_total;  // 编码帧的总数, 默认 0/*** hrd : hypothetical reference decoder (假定参考解码器) , 检验编码器产生的符合* 该标准的NAL单元流或字节流的偏差值。蓝光视频、电视广播及其它特殊领域有此要求*/int  i_nal_hrd;/* vui参数集 : 视频可用性信息、视频标准化选项 */struct{/* 宽高比的两个值相对互素,且在(0,  65535] 之间 */int  i_sar_height; // 样本宽高比的高度int  i_sar_width;     // 样本宽高比的宽度/* 0=undef, 1=no overscan, 2=overscan 过扫描线,默认"undef"(不设置),可选项:show(观看) / crop(去除) */int  i_overscan;/* 以下的值可以参见H264附录E */int  i_vidformat;   // 视频在编码/数字化之前是什么类型,默认"undef".// 取值有:Component, PAL, NTSC, SECAM, MAC 等int  b_fullrange;           // 样本亮度和色度的计算方式,默认"off",可选项:off/onint  i_colorprim;           // 原始色度格式,默认"undef"int  i_transfer;            // 转换方式,默认"undef"int  i_colmatrix;           // 设置从RGB计算得到亮度和色度所用的矩阵系数,默认"undef"int  i_chroma_loc;          // 设置色度采样位置,范围0~5,默认0} vui;/* 比特流参数 */int  i_frame_reference;         // 最大参考帧数目int  i_dpb_size;                // Decoded picture buffer sizeint  i_keyint_max;              // 设定IDR帧之间的最间隔,在此间隔设置IDR关键帧int  i_keyint_min;              // 设定IDR帧之间的最小间隔, 场景切换小于此值编码位I帧, 而不是 IDR帧.int  i_scenecut_threshold;      // 场景切换阈值,插入I帧int  b_intra_refresh;           // 是否使用周期帧内刷新替代IDR帧int  i_bframe;                  // 两个参考帧之间的B帧数目int  i_bframe_adaptive;         // 自适应B帧判定, 可选取值:X264_B_ADAPT_FAST等int  i_bframe_bias;             // 控制B帧替代P帧的概率,范围-100 ~ +100,// 该值越高越容易插入B帧,默认0.int  i_bframe_pyramid;          // 允许部分B帧为参考帧,// 可选取值:0=off,  1=strict hierarchical,  2=normalint  b_open_gop;                // Close GOP是指帧间的预测都是在GOP中进行的。// 使用Open GOP,后一个GOP会参考前一个GOP的信息。int  b_bluray_compat;           // 支持蓝光碟/* 去块滤波器需要的参数, alpha和beta是去块滤波器参数 */int  b_deblocking_filter;        // 去块滤波开关int  i_deblocking_filter_alphac0;// [-6, 6] -6 light filter, 6 strongint  i_deblocking_filter_beta;   // [-6, 6] 同上int  b_cabac;                    // 自适应算术编码cabac开关int  i_cabac_init_idc;           // 给出算术编码初始化时表格的选择int  b_interlaced;               // 隔行扫描int  b_constrained_intra;/* 量化 */int  i_cqm_preset;              // 自定义量化矩阵(CQM), 初始化量化模式为flatchar *psz_cqm_file;             // 读取JM格式的外部量化矩阵文件,忽略其他cqm选项uint8_t  cqm_4iy[16];           // used only if i_cqm_preset == X264_CQM_CUSTOM   uint8_t  cqm_4py[16];uint8_t  cqm_4ic[16];uint8_t  cqm_4pc[16];uint8_t  cqm_8iy[64];uint8_t  cqm_8py[64];uint8_t  cqm_8ic[64];uint8_t  cqm_8pc[64];/* 日志 */void  (*pf_log)( void *, int i_level, const char *psz, va_list );     // 日志函数void  *p_log_private;int    i_log_level;             // 日志级别,不需要打印编码信息时直接注释掉即可int    b_visualize;             // 是否显示日志char   *psz_dump_yuv;           //  重建帧的文件名/* 编码分析参数 */struct{unsigned int intra;             //  帧内分区unsigned int inter;             //  帧间分区int  b_transform_8x8;           // int  i_weighted_pred;           // P帧权重int  b_weighted_bipred;         // B帧隐式加权int  i_direct_mv_pred;          // 时间空间运动向量预测模式int  i_chroma_qp_offset;        // 色度量化步长偏移量int  i_me_method;               // 运动估计算法 (X264_ME_*)int  i_me_range;                // 整像素运动估计搜索范围 (from predicted mv) int  i_mv_range;                // 运动矢量最大长度. -1 = auto, based on levelint  i_mv_range_thread;         // 线程之间的最小运动向量缓冲.  -1 = auto, based on number of threads.int  i_subpel_refine;           // 亚像素运动估计质量int  b_chroma_me;               // 亚像素色度运动估计和P帧的模式选择int  b_mixed_references;        // 允许每个宏块的分区有它自己的参考号int  i_trellis;                 // Trellis量化提高效率,对每个8x8的块寻找合适的量化值,需要CABAC,// 0 :即关闭  1:只在最后编码时使用  2:在所有模式决策上启用int  b_fast_pskip;              // 快速P帧跳过检测int  b_dct_decimate;            // P帧变换系数阈值int  i_noise_reduction;         // 自适应伪盲区int  b_psy;                     // Psy优化开关,可能会增强细节float  f_psy_rd;                // Psy RD强度float  f_psy_trellis;           // Psy Trellis强度int  i_luma_deadzone[2];        // 亮度量化中使用的盲区大小,{ 帧间, 帧内 }int  b_psnr;                    // 计算和打印PSNR信息int  b_ssim;                    // 计算和打印SSIM信息} analyse;/* 码率控制参数 */struct{int  i_rc_method;               // 码率控制方式 : X264_RC_CQP恒定质量,  // X264_RC_CRF恒定码率,  X264_RC_ABR平均码率int  i_qp_constant;             // 指定P帧的量化值,0 - 51,0表示无损int  i_qp_min;                  // 允许的最小量化值,默认10int  i_qp_max;                  // 允许的最大量化值,默认51int  i_qp_step;                 // 量化步长,即相邻两帧之间量化值之差的最大值int   i_bitrate;                // 平均码率大小float  f_rf_constant;           // 1pass VBR, nominal QP. 实际质量,值越大图像越花,越小越清晰float  f_rf_constant_max;       // 最大码率因子,该选项仅在使用CRF并开启VBV时有效,// 图像质量的最大值,可能会导致VBV下溢。float  f_rate_tolerance;        // 允许的误差int    i_vbv_max_bitrate;       // 平均码率模式下,最大瞬时码率,默认0int    i_vbv_buffer_size;       // 码率控制缓冲区的大小,单位kbit,默认0float  f_vbv_buffer_init;       // 设置码率控制缓冲区(VBV)缓冲达到多满(百分比),才开始回放,// 范围0~1.0,默认0.9float  f_ip_factor;             // I帧和P帧之间的量化因子(QP)比值,默认1.4float  f_pb_factor;             // P帧和B帧之间的量化因子(QP)比值,默认1.3int   i_aq_mode;                // 自适应量化(AQ)模式。 0:关闭AQ  // 1:允许AQ在整个视频中和帧内重新分配码// 2:自方差AQ(实验阶段),尝试逐帧调整强度float  f_aq_strength;           // AQ强度,减少平趟和纹理区域的块效应和模糊度/* MBTree File是一个临时文件,记录了每个P帧中每个MB被参考的情况。目前mbtree只处理P帧的MB,同时也不支持b_pyramid. */int   b_mb_tree;                // 是否开启基于macroblock的qp控制方法int   i_lookahead;              // 决定mbtree向前预测的帧数/* 2pass */int   b_stat_write;             // 是否将统计数据写入到文件psz_stat_out中char  *psz_stat_out;            // 输出文件用于保存第一次编码统计数据int   b_stat_read;              // 是否从文件psz_stat_in中读入统计数据char  *psz_stat_in;             // 输入文件存有第一次编码的统计数据/* 2pass params (same as ffmpeg ones) */float  f_qcompress;             // 量化曲线(quantizer curve)压缩因子。// 0.0 => 恒定比特率,1.0 => 恒定量化值。float  f_qblur;                 // 时间上模糊量化,减少QP的波动(after curve compression)float  f_complexity_blur;       // 时间上模糊复杂性,减少QP的波动(before curve compression)x264_zone_t *zones;             // 码率控制覆盖int    i_zones;                 // number of zone_t'schar  *psz_zones;               // 指定区的另一种方法} rc;/* 裁剪矩形窗口参数:隐式添加到分辨率非16倍数的视频中 *//* 在码流层指定一个切除(crop)矩形。若不想x264在编码时做crop,但希望解码器在回放时进行切除,可使用此项。单位为像素。 */struct{unsigned int i_left;unsigned int i_top;unsigned int i_right;unsigned int i_bottom;} crop_rect;/* 编码3D视频时,此参数在码流中插入一个标志,告知解码器此3D视频是如何封装的。3D视频帧封装格式:帧封装、场交错、线交错、左右全景、左右半景、上下半景、L+深度、L+深度+图形+图形深度 */int  i_frame_packing;/* Muxing复用参数 */int  b_aud;                     // 生成访问单元分隔符int  b_repeat_headers;          // 是否复制sps和pps放在每个关键帧的前面int  b_annexb;                  // 值为true,则NALU之前是4字节前缀码0x00000001;// 值为false,则NALU之前的4个字节为NALU长度int  i_sps_id;                  // sps和pps的id号int  b_vfr_input;               // VFR输入。1 :时间基和时间戳用于码率控制  0 :仅帧率用于码率控制uint32_t  i_fps_num;            // 帧率的分子uint32_t  i_fps_den;            // 帧率的分母uint32_t  i_timebase_num;       // 时间基的分子uint32_t  i_timebase_den;       // 时间基的分母/* 以某个预设模式将输入流(隔行,恒定帧率)标记为软交错(soft telecine)。默认none. 可用预设有:none, 22, 32, 64, double, triple, euro.  使用除none以外任一预设,都会连带开启--pic-struct */int  b_pulldown;int  b_pic_struct;  // 强制在Picture Timing SEI传送pic_struct. 默认是未开启/* 将视频流标记为交错(隔行),哪怕并非为交错式编码。可用于编码蓝光兼容的25p和30p视频。默认是未开启 */int b_fake_interlaced;/* 条带参数 */int  i_slice_max_size;          // 每个slice的最大字节数,包括预计的NAL开销int  i_slice_max_mbs;           // 每个slice的最大宏块数,重写i_slice_countint  i_slice_count;             // 每帧slice的数目,每个slice必须是矩形
} x264_param_t;

【2】libx264 控制码率参数设置示例

第一,profile,即设置使用baseline,main,high 编码
x264_param_apply_profile(x264Encoder.m_pX264Param, "baseline");第二 编码复杂度
param.i_level_idc=30;第三图像质量控制
rc.f_rf_constant是实际质量,越大图像越花,越小越清晰
param.rc.f_rf_constant = 25;
param.rc.f_rf_constant_max ,图像质量的最大值
param.rc.f_rf_constant_max = 45;第四 码率控制param.rc.i_rc_method = X264_RC_ABR;//参数i_rc_method表示码率控制,CQP(恒定质量),CRF(恒定码率),ABR(平均码率)
param.rc.i_vbv_max_bitrate=(int)((m_bitRate*1.2)/1000) ; // 平均码率模式下,最大瞬时码率,默认0(与-B设置相同)
param.rc.i_bitrate = (int)m_bitRate/1000;
注意,x264使用的 bitrate 需要除以 1000第五,使用实时视频传输时,需要实时发送spspps数据
param.b_repeat_headers = 1; // 重复SPS/PPS 放到关键帧前面
该参数设置是让每个I帧都附带sps/pps第六,I帧间隔
以下设置是每2秒刷新一个I帧
param.i_fps_num = (int)m_fr<x>ameRate;
param.i_fps_den = 1;
param.i_keyint_max = m_fr<x>ameRate * 2;第七编码延迟
在使用中,开始总是会有编码延迟,导致本地编码立即解码回放后,存在巨大的视频延迟,
通过如下设置,可以实现即时编码,注意主要设置zerolatency参数
x264_param_default_preset(&param "fast" "zerolatency" );

参考致谢

本博客为博主的学习实践总结,并参考了众多博主的博文,在此表示感谢,博主若有不足之处,请批评指正。

【1】(转)x264重要结构体详细说明(1): x264_param_t

【2】x264编码器的参数设置

  相关解决方案