C语言音频实现小黄人变声
前面提及到《大话音频变声原理 附简单示例代码》与《声音变调算法PitchShift(模拟汤姆猫) 附完整C++算法实现代码》
都稍微讲过变声的原理和具体实现。
大家都知道,算法从实现到最后工程应用,中间的环节和问题特别多。
尤其是编码的架构设计,好的数据结构和代码逻辑封装肯定是可复用,组件化的。
前几天写完《音频识别算法思考与阶段性小结》的时候,
我也提及到了。
会做一些算法编码优化相关的分享。
而有时候我总觉得文字表达很苍白,
所以我尽可能地把代码写得简洁易懂,
一方面是便于基础差的朋友学习。
另一方面也是为了自己在编码以及思考的时候,能更加清晰。
当然,变声算法绝大多数朋友都会选择一些开源的或者商业sdk去做二次开发。
例如:
https://www.surina.net/soundtouch/
但如果仅仅停留在使用的阶段,它就是一个黑盒子。
知其然,却不知其所以然。
是远远不够的。
有时候我们是要站在巨人的肩膀上去看到更美丽的风景。
但是,我希望是一群人,而不是一个人。
也许大家也发现了,我写的大多数算法,是纯c无第三方依赖的。
是不是就会怀疑,我就只会写c语言?
不是的,我所掌握的编程语言:
主要: c,c++,python,汇编
其次:pascal,c#,js,lua,go等
编程语言只是一个工具,关键还是算法思路。
用纯c写的主要目的,是为了破除一些第三方依赖,
不要一知半解地使用黑盒子。
当然,其次的好处就是跨平台,便携,可复用。
这样,一切了然于心。
为什么不可以造轮子呢?
只要你造的轮子是有用的,
不管是用于观赏用于学习还是其他用途。
在我了解到一些音频算法的思路之后,
变声算法的思路,
我觉得它的思路非常适用于扩展到大多数音频算法实现,
而且可复用度比较高。
所以,将它梳理开源,就显得特别有意义。
而大家可以基于这个实现,进一步去改进或者学习 音频算法,
例如降噪,增益等等。
因为这个编码实现的设计是完全可以适用到音频算法应用场景的。
逻辑也非常清晰。
项目地址:
https://github.com/cpuimage/pitchshift
当然为了便于一些朋友的学习使用,
示例代码提供一个简易的实现,
模拟变声为小黄人。
int main(int argc, char *argv[]) { printf("Audio Processing n"); printf("blog:http://cpuimage.cnblogs.com/ n"); printf("Pitch Shifting Using The Fourier Transformn"); if (argc < 2) return -1; char *in_file = argv[1]; uint32_t sampleRate = 0; uint64_t totalSampleCount = 0; uint32_t channels = 0; short *data_in = wavRead_s16(in_file, &sampleRate, &totalSampleCount, &channels); if (data_in != NULL) { float pitchShift = 0.9f; size_t ms = 50; size_t overSampling = 4; size_t frameSize = sampleRate * ms / 1000; frameSize += frameSize % 2; planData pitchPlanData = {0}; double startTime = now(); makePlanData(frameSize, overSampling, sampleRate, &pitchPlanData); pitchshift(pitchShift, data_in, data_in, totalSampleCount, &pitchPlanData); // turn to minion pitch { totalSampleCount /= 2; short *samples = data_in; for (int i = 0; i < totalSampleCount; i++) { data_in[i] = samples[0]; samples += 2; } } double time_interval = calcElapsed(startTime, now()); freePlanData(&pitchPlanData); printf("time interval: %f msn ", (time_interval * 1000)); } char drive[3]; char dir[256]; char fname[256]; char ext[256]; char out_file[1024]; splitpath(in_file, drive, dir, fname, ext); sprintf(out_file, "%s%s%s_out%s", drive, dir, fname, ext); wavWrite_s16(out_file, data_in, sampleRate, totalSampleCount); if (data_in) { free(data_in); } printf("press any key to exit.n"); getchar(); return 0; }
不做多解释,大家可以参阅pitchshift函数的实现,
主要实现位于文件PitchShift.h。
整个算法不到200行,逻辑非常清晰,
已经做了一定程度上的工程化优化。
当然还有很大的改进空间,
不过这份代码,更多的意义在于学习。
授人以鱼不如授人以渔。
若有其他相关问题或者需求也可以邮件联系俺探讨。
邮箱地址是:
gaozhihan@vip.qq.com
- Entity Framework——记录执行的命令信息
- 【BlackHat 2017 议题剖析】连接的力量:GitHub 企业版漏洞攻击链构造之旅
- CVE-2015-1641 Word 利用样本分析
- Cloudera Navigator介绍与安装
- [LeetCode]String主题系列{第5,6题}
- CDH内存调拨过度警告分析
- Ztorg:从 root 到 SMS
- [LeetCode]Math主题系列{第7,9,13,273题}
- 被忽视的攻击面:Python package 钓鱼
- [LeetCode]LinkedList主题系列{第2题}
- [LeetCode]HashTable主题系列{第3题}
- 如何使用Oozie API接口向Kerberos集群提交Java程序
- [LeetCode]Array主题系列{35,39,40,48题}
- 如何使用Sqoop2
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- CAM 系列论文阅读总结
- kafka客户端指标上报Prometheus方案(已开源)
- 2020-09-25:rust中Point是结构体类型,【let p1=Point{x:25,y:25};let p2=p1;】...
- R语言在BRFSS数据中可视化分析探索糖尿病的影响因素
- R语言可视化探索BRFSS数据并逻辑回归Logistic回归预测中风
- R语言对BRFSS数据探索回归数据分析
- 使用R语言创建自定义桑基图Sankey图
- 在r语言中使用GAM(广义相加模型)进行电力负荷时间序列分析
- R语言中的偏最小二乘回归PLS-DA
- R语言实现偏最小二乘回归法 partial least squares (PLS)回归
- 用于NLP的Python:使用Keras的多标签文本LSTM神经网络分类
- python爬虫进行Web抓取LDA主题语义数据分析报告
- Python使用神经网络进行简单文本分类
- 在Python中自然语言处理生成词云WordCloud
- 使用Python中的ImageAI进行对象检测