转自:rohm,作者:Jan Gromes
https://techclass.rohm.com.cn/knowledge/deviceplus/how-tos/arduino/arduino-dsp-intro-to-digital-signal-processing-using-matlab-part-1
这篇文章来源于DevicePlus.com英语网站的翻译稿。
第1部分
在本教程中,我们将分析语音信号。我们人类发出的声波是连续的模拟信号,然而对于信号处理,我们需要一个非连续时间模型——计算机的数字模型。本文的主要目的是帮助大家了解如何实现数字信号处理。我们将会比较自己录制的声音和一个失真信号,从中寻找2个语音信号之间的相似点和不同点。
对于这个项目,有一点比较重要:我们应该在应用不同的参数时,着重了解波形模式以及它们如何随时间变化。在本文(第1部分)中,我们将探讨语音信号的一些特性以及如何使用MATLAB处理这种信号;然后,我们使用Arduino对录制的语音信号进行详细分析。
软件
Audacity//www.58yuanyou.com
Matlab
Arduino IDE
第1步:关于语音信号
处理语音信号时,我们要了解“信号”的含义,这一点很重要。那信号是什么?
通信信号处理 ,作者Paolo Prandoni与Martin Vetterli:
“信号”是对随时间或空间演变的现象的一种形式描述;通过信号处理,我们可以描述任何手动或“机械”操作,从而修改、分析或操控一个信号中包含的信息。我们举个环境温度的简单例子:我们就这个物理变量的正式模型达成一致——比如摄氏度——之后,我们可以用各种方式记录温度随时间的变化,而结果数据集就代表一个温度“信号”。
第一步,我们将了解语音信号的属性。录制自己的声音之前,让我们首先在Audacity中了解一些不同的参数。
声道数量:
单声道:您使用一个声道进行录音,这意味着只有一个音频信号——录音分布在同一音量级别。原由网因此如果您有两个或更多扬声器,您听不出差异。这是最常用的方法,因为声音是用一个麦克风录制的,这意味着单声道占用的带宽较少,因此对许多应用(比如电话和无线电)来说非常有用。对于不太熟悉音频设备放置技术细节的用户来说,单声道是正确的选择。
图1:单个音频信号在同一音量级别上分配给多个扬声器(单声道)
立体声:您用两个或更多声道录音。由于信号来自多个信号源,因此能够描述声音的方向和位置。使用立体声设置意味着您需要将至少2个麦克风放置在适当的位置。通过这种方式,您可以确定多个声源的不同位置。这种录制通常用于电影和音乐,以获得更广泛的声场解析。
图2:两个或多个信号通道分配到扬声器(立体声)
项目速率(采样率):在一秒内对连续时间信号的采样次数,然后将其转换为离散时间信号(数值)。采样的度量单位是S/s(即每秒采样数)。
由于音频信号是模拟信号,我们需要将其转换为数字信号,以便由计算机进行处理。我们可以使用下面的采样定理完成此操作。
我们假设有一个模拟信号,如下图所示。想象一下,您需要向您的朋友描述这个信号。这项任务并不是最简单的任务。在这种情况下,将信号描述为数字序列将更加简单。
图3:模拟信号示例
每个样本都以其自身的幅度进行描述。用户可以根据自己的喜好选择采样率。下图显示了如何根据采样定理将模拟信号转换为数字信号。
图4:模拟信号转换为数字信号
采样率必须根据人类听觉范围——20Hz至20000Hz——进行选择。为了能够获得特定信号(即准确声音)的所有必要信息,我们的采样率必须满足以下奈奎斯特-香农定理才能将其转换为离散时间信号:
采样率必须大于信号频谱中最高(最大)频率的两倍。在我们的例子中,最大频率为20000Hz。
本项目我们选择48000Hz——这是处理音频信号时的一个标准值。在这种情况下,信号处理时连续时间信号中的所有信息都没有丢失。
说到采样率,一般有2种情况:
过采样– 维基百科
采样频率显著高于奈奎斯特速率。从理论上讲,如果以奈奎斯特速率或高于奈奎斯特速率进行采样,就可以完美重建有限带宽的信号。奈奎斯特速率的定义为信号中最高频率分量的两倍。
欠采样(或走样)– 维基百科
这种技术以低于其奈奎斯特速率(高截止频率的两倍)的采样率采样带通滤波信号,但是仍然能够重建信号。如果以欠采样方式采样一个带通信号时,采样点与高频信号的低频分量采样点无法区分(即信号变得难以区分)。
接下来,我们通过正弦波进行演示。
图5:一个正弦波(在MATLAB中绘制)
这是一个频率为2Hz、时域为[-1,1]的正弦波。该波形包含4个周期,这意味着每0.5秒(1/2 Hz)发生一个周期。我们会对这个信号实施多种采样案例,以了解采样的工作原理。
采样点数表示在一个周期内添加了多少个点,并这些点会用插值算法连接起来。一个周期的最小点数应为20,否则线性插值信号看起来就会失真。这尤其适用于平滑的模拟信号,采样后会丢失圆边图案。点的数量越多,采样信号越准确。
图6:正弦波的必要点数(在MATLAB中绘制)
在本教程中,我们会在MATLAB中绘制一些正弦波,并观察采样频率不同时这些正弦波的行为。在语音信号系列的第二部分中,我们将使用MATLAB进行傅立叶分析。使用Arduino时,MATLAB也是一个非常有用的工具,因为它可以利用串行接口很好地进行通信。我们将在本系列的第三部分中详细介绍如何用Arduino录制语音信号并在MATLAB中进行处理。
对于那些不完全熟悉MATLAB的人,绘制函数的一般步骤如下所示:
要创建脚本或函数,请转到 [HOME] → [New] ,然后选择“”(脚本)或“Function”(函数)。
要绘制图7中所示的正弦波,我们需要创建一个。复制并粘贴以下代码:
subplot(4,1,1)plot(t,wave)title('5 points plot')
points1 = 10;
t = 0:1/points1:1;wave1 = sin(2*pi*f*t);subplot(4,1,2)plot(t,wave1)title('10 points plot')
points2 = 15;t = 0:1/points2:1;wave2 = sin(2*pi*f*t);subplot(4,1,3)plot(t,wave2)title('15 points plot')
points3 = 20;t = 0:1/points3:1;wave3 = sin(2*pi*f*t);subplot(4,1,4)plot(t,wave3)title('20 points plot')
要查看结果,您只需按 Run按钮即可。
我们还需要创建另一个图——就在刚刚创建的图上绘制,以查看我们对信号进行采样时信号的形式如何变化。信号长度我们选取0.5秒,但是频率增加为60。我们处理的点数也修改为频率数的20倍。假设在这个区间内我们以50Hz的频率进行采样;这意味着每个点都位于T=1/50(其中T是采样周期)处。图7中的小红点就是信号上的采样点。
图7:欠采样正弦波
在图7中,由于缺少采样点,我们无法掌握原始信号的形状。连接采样点后,由于信号的点不足,红色信号的形状异常(图8)。这些点无法以正弦形式插值,红色信号不能重建蓝色信号。
图8:正弦波,fs = 50 Hz
图9:正弦波,fs = 240 Hz
图10:采样频率示例
如图9和图10所示,当我们以2倍频率进行采样时,图中的唯一采样点就是顶部和底部的最大值。根据采样定理,这两个点足以重建信号。
第2步:处理语音信号
上文介绍了信号及其属性。现在我们需要用一个实际例子进行测试。Audacity的录音属性如下:
采样率:48000 Hz
位数:16
图11:Audacity录制所需的设置
信号长度应至少为10秒左右(项目会进行许多处理,因此不建议超过20秒)。
图12:Audacity
与其他录制平台相比,Audacity非常直观。在下图中,您可以看到一个中间有圆圈的红色按钮(record图标) – 这就是开始录音的按钮。要停止录制,只需按下黄色方块按钮(stop 按钮)即可。程序会记录录音的声波,并将其绘制处理,如下图所示。
图13:录制的音频信号
第1部分简要介绍了数字信号处理理论。我们使用MATLAB探索了不同的信号波形,并用Audacity录制了自己的声音。在下一个教程中,我们将深入探讨“处理”的更多细节。我们将涉及各种算法和时频域。我们会继续利用MATLAB作为函数编写的主要工具,以处理我们录制的语音并获得分析结果。
第2部分
在Arduino DSP系列的第二部分中,我们将继续深入研究数字信号处理的基础知识。我们将学习数字滤波器的特性以及在MATLAB中处理信号时如何应用这些特性。在下一篇文章中,我们将制作一期有关傅里叶变换的深入教程,并研究语音信号最重要的参数:频率。
软件
Matlab
第1步:如何将信号导入 Matlab
用Audacity录制语音信号后,现在是时候在MATLAB中进行处理了。此功能可以通过 wavread函数完成,该函数负责读取(.wav)声音文件。Audacity的输出信号具有此扩展名。此函数的输入是信号名称(testSound.wav),在MATLAB函数中,您只需要写“testSound”即可。该函数的输出如下所示:
Y – 信号名称
Fs – 信号的采样率
Bits – 位数
我们可以使用以下代码实现此函数。该代码还能够播放声音,让用户在信号处理过程中听到信号如何随时间变化。
图1:Matlab中的语音信号
如果您想获得人声信号的更多信息,您只需输入音频文件名称(后缀名为.wav),然后函数 audioinfo就会给您返回声音参数。
此函数非常方便,尤其是当一个信号是未知信号时。比如,如果在处理一个信号时无法确定采样率、持续时间和位/样本等必要信息,那么就可以使用上述函数查询该信号的更多信息。
图2:信号属性
图3:声波及其平均值
第2步:去除平均值(或DC分量)
直流(DC)分量是添加到纯交流(AC)波形(比如语音信号)的恒定电压。纯AC波形的真实平均电压为零。语音信号是模拟信号,但是用Audacity将其转换为数字信号时,会获得一个DC分量。发生这种情况是因为Audacity拥有自己的范围并对信号进行了重新调整。通常,模拟信号范围为-0.5至0.5V。我们需要0.5V的直流分量,这是因为程序使用一系列正数来缩放样本值(每个样本值被转换为从0到N的数字;N是自然数)。
图4:交流分量和直流分量说明
但是,如果存在DC分量,那么AC的幅度会根据DC分量的值发生变化。我们来看一下 图 4。假设您有一个幅度为2V峰-峰值的正弦波,同时叠加了一个0.5V的直流分量,那么最终信号的幅度最高为1.5 V,最低为-0.5 V。
我们应该查看一下信号是否具有直流分量,并且要确定直流分量的值。我们可以通过绘制数值来实现,也可以在命令窗口中输入M实现。
图5:信号平均值
去除平均分量很重要,因为语音信号本身不含直流分量,而我们希望使用纯净的音频波形。removeDC函数中的以下代码能够计算信号的平均值并将其从原始信号中除去。
第3步:抽取过程
我们的采样频率现在为48000Hz,我们希望将其变成16000Hz。通过抽取,我们可以降低信号的采样率。抽取可以通过MATLAB中的 decimate 函数实现。当我们对一个语音信号进行采样时,根据奈奎斯特采样定理,最小频率应为8kHz——这是因为人类听觉最大带宽为4kHz。
这样做是因为我们想比较原始信号与抽取信号之间的差异,并了解这种修改如何改变原始信号。
图6:抽取的信号
进行抽取(或下采样)时,我们将采样率修改成较低的速率(与之前的采样率相比)。如下图所示,左侧模拟信号的采样率高于右侧的模拟信号。这意味着我们对采样频率进行抽取。
图 7: 抽取的信号
我们还可以进行上采样——下采样的反过程,并增加采样频率。这可以通过插值技术和低通滤波器来完成。
s2 = decimate(s0,3);t1=linspace(0,length(s2)/fe2, length(s2));figure plot(t1,s2),grid title('Decimate the signal'); ylabel('s(n)');sound(s2,fe2);pause(9)
第4步:信号滤波
简单来讲,数字滤波器是一种离散时间、离散幅度的卷积器。数字滤波器在信号处理中很重要,因为与模拟滤波器相比,它可以处理多个操作。(我们可以假设数字滤波器的成本更高,因为我们需要特殊的数字信号处理器来运行滤波算法的功能。)
每个数字滤波器都有不同的规格:通带、阻带和纹波。我们首先回顾一下以下术语。
通带:一个滤波器允许通过的频率带。
截止频率:用户选择的某个频率,表示可以通过滤波器的理论频率。为了避免走样,此频率必须低于采样频率/2 。在电子学中,截止频率是指信号功率变小两倍的频率值。
阻带:所有高于此频段的频率都无法通过滤波器。
数字滤波器可以分为两类: FIR(有限脉冲响应),滤波器系数为整数。IIR(无限脉冲响应),具有模拟等效模型,并且阶数较低时更有效。
FIR/IIR滤波器最重要的特性之一是相位特性:
FIR: 线性相位特性
IIR:非线性相位特性(或相位失真)
FIR滤波器属性 – dspGuru by Iowegian International
“线性相位是指滤波器的相位响应是频率的线性(直线)函数(不包括+/-180度的相位缠绕)。这使得通过滤波器的所有频率的延迟都相同。因此,这种滤波器不会引起“相位失真”或“延迟失真”。在某些系统中,比如在数字数据调制解调器中,没有相位/延迟失是FIR滤波器相对于IIR和模拟滤波器的关键优势。”
MATLAB中有众多类型的数字滤波器可供选择,但是我们需要了解如何将其应用于我们的具体场景。对于本项目,我们选用IIR滤波器,因为它更有效,即与FIR滤波器相比,我们需要更小的阶数。
图 8: IIR 滤波器
以下代码可以在MATLAB中创建一个Butterworth滤波器。添加滤波器阶数和截止频率后,此函数会返回滤波器系数。
在命令行中输入 help butter ,就可以通过MATLAB帮助了解为什么采样率会除以2。“[b,a] = butter(n,Wn)会返回一个n阶低通数字Butterworth滤波器的传递函数系数以及归一化截止频率Wn”,且“截止频率Wn必须满足0.0 < Wn < 1.0,1.0对应于采样率的一半。”
滤波器系数存储在 Bd 和Ad变量中。
数字滤波器术语 – dspGuru by by Iowegian International
滤波器系数– 与数字滤波器结构内的延迟信号采样值相乘的常数集。数字滤波器设计就是要确定产生所需滤波器频率响应的滤波器系数。对于FIR滤波器,根据定义,滤波器系数就是滤波器的脉冲响应。
滤波器阶数– 上述每种滤波器都有一个阶数(N)特征;N阶是指实现滤波器所需无功元件的数量。对于IIR滤波器,滤波器阶数等于滤波器结构中的延迟元件数。通常,滤波器阶数越大,滤波器的频率幅度响应性能越好。
此滤波器的另一个重要方面是频率响应——滤波器如何影响频谱分量。滤波器的理想频率响应应该是一个完整的矩形,其幅度为1,截止频率为0.5。在现实生活中,您可以根据自己的应用场景选择滤波器类型。
一个数字滤波器的频率响应如下图所示。在我们的例子中,通带的幅度平坦,没有纹波。截止频率为3400Hz,这意味着我们的信号通过了一个低通滤波器,其频率不会超过此限值。如图所示,截止频率后面没有阻带,这就是为什么可能有其他频率比它高的原因。这可以通过增加滤波器的阶数来改善。
图 9: 滤波器的频率响应
如图10所示,椭圆滤波器在截止频率处的幅频曲线下降最陡,但振幅不稳定。切比雪夫1和2在通带和阻带中有幅度波动。Butterworth滤波器在这两个频段上都没有幅度波动,因此我们在应用中采用了这种滤波器;然而,这种滤波器的缺点是其过渡带较大。
图 10: IIR 滤波器类型
IIR滤波器的阶数小于FIR滤波器的阶数。
图 11: 不同阶数的Butterworth滤波器
在本文应用中,我们将滤波器的阶数设为40,以使频率响应尽可能地接近理想频率响应。如图11所示,随着滤波器阶数的增加,性能在频率响应方面也会提高。
对信号进行滤波和抽取之后,我们需要观察原始信号与变换信号之间的差异。我们使用绘图功能并生成一个音频信号。
验证结果是否有效的最简单方法就是查看这些信号。我们来比较一下原始信号(48kHz采样率)和最终信号(16kHz采样率)。最终信号没有太大的噪音,这是一件非常好的事情。
图 12: 原始信号与经过滤波的信号之间的差异
在第2部分中,我们的目标是学习数字滤波器的特性并用MATLAB进行测试。到目前为止,我们已经设法了解了采样率的含义以及采样率的变化如何影响音频信号。在下一篇文章中,我们将从另一个角度——利用傅里叶变换(即频域)——处理音频信号。
第3部分—傅里叶变换
在第3部分中,我们的目标是了解如何将正弦信号从时域转换到频域。这个操作过程很重要,因为您可以以此了解在频率范围内可以确定多少信息。例如,ECG(心电图)中如果仅有时域信号,信息量是不够的,因为它只包含了随时间变化的心跳记录(即信号)。但是,在ECG中补充频域分析就能够提供一段时间内信号幅度变化发生次数的有关信息。频域信息以此方式展示了在一定频率范围内,信号在每个给定的频率带是如何分布的。使用傅里叶变换(FT)可以完成时域和频域之间的信号转换。
硬件
• Arduino Uno
• 用于Arduino的MAX9812L驻极体麦克风传感器板
软件
Arduino IDE
MATLAB
步骤 1:傅里叶变换简介
我们首先了解一下相关定义。信号是“传递某种现象的行为或属性信息的一种函数。” 时域表示信号的幅度是如何随时间变化的,而频域则表示随频率变化的幅度频。让我们再次看一下心电图(ECG)示例。心电图显示的是重复的信号波,可以观察到这些信号波的特征是如何随时间变化的(即信号是如何演化的)。很难对一段较长时间内记录的ECG的每个重要成分都进行分析。在这种情况下,您可以将信号转换到频域,并观察在特定时间间隔内重复的每个分量。这就是傅里叶变换的来历。
FT也会在图像和视频压缩中用到。例如,jpg和 mp3是使用了快速傅里叶变换(FFT)算法的图像和声音的数字格式。由于必须使用模数转换器将每个连续的模拟信号转换为数字信号,所以需要以特定频率对这些信号进行采样。这样,我们可以利用离散傅里叶变换获取离散信号。
傅里叶级数的有趣之处在于,每个波形都可以写成正弦和余弦的总和,但是具有离散频率分量。使用TF,我们可以将波形分解为正弦波。
让我们看一下由多个正弦波组成的信号。该图显示了一个来自现实世界的具有多个频率分量的信号:
图1:初始信号
我们将会通过下面的所有步骤来逐步添加正弦波,以确定该信号是如何形成的。
f1 = 1;
f2 = 0.5;
f3 = 1.5;
f4 = 4;
t = 0:0.01:4;
A1 = 0.5;
A2 = 2.5;
A3 = 7.5;
A4 = 3.5;
x1 = A1*sin(2*pi*f1*t)
x2 = A2*sin(2*pi*f2*t)
x3 = A3*sin(2*pi*f3*t)
x4 = A4*sin(2*pi*f4*t)
x = x1 + x2+ x3+ x4
添加到图形中的第一个信号如下:
figure %Figure 2
subplot(2,1,1)
plot(t,x,t,x1)
subplot(2,1,2)
plot(t,x1)
图2:形成图1信号的第1步
在图2中,正弦波(底部)被绘制在初始信号(顶部)中。初始信号还包含许多其它信号。我们将尝试获取顶部图形中的蓝色信号,证明任何信号都可以表示为一些正弦信号之和。
figure %Figure 3
subplot(3,1,1)
plot(t,x,t,x1+x2)
subplot(3,1,2)
plot(t,x2)
subplot(3,1,3)
plot(t,x1+x2)
以下信号应该尽可能接近原始信号。在随后的每个图中将具有以下三个子图:
1. subplot(3,1,1):在同一坐标图中绘制两个图形,蓝色表示初始信号,由不同频率的正弦波叠加而成,绿色表示获得原始信号之前的所有步骤中所添加信号的总和。
2. subplot(3,1,2):当前步骤中所添加的信号,由另一个幅度和频率来表达。
3. subplot(3,1,3):信号总和 – subplot(3,1,1) 中的绿色信号,没有重叠部分。
图3:形成初始图像的第2步
从图3中可以看出,信号已经开始形成初始信号的波形。在subplot(3,1,3)中,您可以观察到形状由于添加了更多的信号而发生了变化。从这一步开始,信号不再是标准的正弦曲线形状。
figure %Figure 4
subplot(3,1,1)
plot(t,x,t,x1+x2+x3)
subplot(3,1,2)
plot(t,x3)
subplot(3,1,3)
plot(t,x1+x2+x3)
图4:形成原始信号的第3步
在图4中,我们可以观察到subplot (3,1,3)的信号幅度是如何演变的。A3 = 7.5 表明,当添加多个信号时,所得信号的幅值是由每个信号的幅值相加得到的。
figure %Figure 5
subplot(3,1,1)
plot(t,x,t,x1+x2+x3+x4)
subplot(3,1,2)
plot(t,x4)
subplot(3,1,3)
plot(t,x1+x2+x3+x4)
在正弦信号相加过程的最后一步中,演示了原始信号是如何形成的。最后添加的信号相比于上一步中添加的信号具有更高的频率。与上图相比,我们可以观察到图5中的subplot(3,1,3)包含更多的曲线波形。
图5:形成原始信号的最后一步
如图5所示,subplot(3,1,1)的绿色信号与subplot(3,1,3)的蓝色信号之间没有任何区别。该示例很重要,因为它展示了傅里叶级数的逻辑,即将一个信号可以描述为不同频率正弦波之和。
傅里叶变换被用于那些需要在频域中执行的操作(例如滤波)。在频域中获得结果后,我们可以将信号转换回时域,以便于在后续处理中使用。
步骤2:背后的算法
复数是傅里叶变换算法中的一个重要概念。复数可以表示为z = a + bi,其中a& b为实数,i是虚数,为x2 -1的解(因为该式没有实数解,所以解被认为是虚数)。
下图显示了如何用图形表示复数。您可以通过Argand 图对复数进行几何表示。x轴表示复数的实部,y轴表示复数的虚部。
图6:复数的实部和虚部
时域和频域的每个分量都由包含了N个复数点的信号来描述。每个点都由用于描述信号分量的实部和虚部组成。有一个应用于现实生活中的电气工程领域的实例:使用傅里叶变换可以帮助我们分析变化的电压和电流。
图7:傅里叶变换中使用的实部和虚部展示
快速傅里叶变换(FFT)的过程是将一个包含N个样本点的时域信号分解为N个时域信号,每个时域信号表示一个样本点信息。第二步是计算这N个时域信号相对应的N个频谱。最后,将N个频谱合为一个频谱。
点击此处可以找到有关傅里叶变换的更多信息。
图8:时域分解
使用傅里叶变换时的一些重要规则如下:
• 时域中的点数等于频域中的点数。
• 假设您有一个包含DC值的正弦波– 频谱中的第一个点将具有零频率值(DC值),而下一个点为正弦频率。
• 当从时域转为频域时,可以使用第n个点的频率进行绘制:f = (n-1) SR/N,其中N为样本点数。
• 频率为f = 1/T,其中T为周期。
让我们来看一下下面的代码,以了解在MATLAB中是如何实现傅里叶变换的。
t = 0:1/1000:1-1/1000;
x = sin(2*pi*30*t);
plot(t,x)
从 向量t中可以观察到,点采样是在1/1000范围内进行的,因此采样率为1000 Hz(1000 1s或 s-1)。您还记得之前的文中提到的采样率应该是信号频率的两倍吗?
下面的正弦波的频率为30Hz。
图9:在MATLAB中生成的正弦波
当我们想要进行傅里叶变换时,使用fft(x)指令。
y = fft(x);
f = (0:length(y)-1)*1000/length(y);
plot(f,abs(y))
当我们在频域中绘图时,x轴将除以2。
使用傅里叶变换后,我们只需要一半的采样率即可观察到信号的频谱分量。
图10:MATLAB中的fft函数图
当在正弦信号上应用FFT时,其唯一的属性是与时域中所描述的频率点相对应的频谱分量,在本例中为30 Hz。
如果将长度指令应用于向量t,则返回:
>> length(t)
ans =
1000
如 图 11所示,当我们对所有点进行绘制时,可以观察到一个有趣的现象:970 Hz(1000-30 Hz)处还有一个频谱分量。这意味着y轴以500 Hz为中心发生了镜像翻转,对应了采样率除以2的结果。
目前OYfAb为止,我们的项目已经快要完成了。请继续阅读下一篇文章来了解如何添加失真滤波器使信号发生变形。然后,我们将在使用MATLAB创建的GUI上继续对声音信号进行处理。
第4部分—在MATLAB中创建GUI
本文是DSP Arduino系列的续篇。上文中,我们介绍了傅里叶变换的基础知识,并使用MATLAB学习了如何将正弦信号从时域变换到频域。这次,在添加了失真滤波器后,我们将在MATLAB中创建一个简单的GUI来记录我们的语音信号!
硬件
• Arduino Uno
• 用于Arduino的CJMCU-9812 MAX9812L驻极体麦克风放大器开发板
软件
• Arduino IDE
• MATLAB
步骤3:应用失真滤波器
在前文中,我们已经得到了一个通过了40阶低通滤波器的信号。在此步中,我们需要添加另一个会使信号失真的滤波器。这可以通过MATLAB中的filter函数来完成。您可能已经想到了,我们还需要添加下文所示的系数。
[s,fe2,bits] = wavread(‘s’);
sound(s,fe2);
pause(9)
b = [0.1662, -0.0943, 0.2892, -0.1227, 0.2348, 0.0180, 0.0415, 0.1388, -0.0616, 0.1290, -0.0434, 0.0420, -0.0010, -0.0009, 0.0032, -0.0015, 0.0056] ;
a = [1.0000, -0.7548, 3.4400, -1.6385, 4.8436, -0.8156, 3.2813, 1.2582, 0.6571, 2.1922, -0.4792, 1.4546, -0.2905, 0.4693, -0.0208, 0.0614, 0.0120] ;
x = filter(b,a,s);
figure
plot(t1,s2,t1,x),grid
title(‘The initial signal vs the distorted signal’);
sound(x,fe2);
pause(9)
audiowrite(‘x.wav’,x,fe2);
请注意,s是指在上一步中应用了低通滤波器之后获得的信号。在图1中,蓝色信号代表原始信号,绿色信号代表失真信号。与蓝色信号相比,绿色信号具有较低的幅度。
图1:重叠信号
为了进一步进行检验,我们将使用FFT算法。
为了更好地进行比较,我们对两个信号分别进行了绘制。下面的两个图将会说明在时域和频域中两者之间的差异。
% s si x signals (time-frequency domain)
t1=(0:length(s)-1)/(fe2);
figure
subplot(2,1,1), plot(t1,s),grid
title(‘s signal in time domain(low-pass filter)’);
xlabel(‘Time’)
ylabel(‘Amplitude’)
t2=(0:length(x)-1)/(fe2);
subplot(2,1,2), plot(t2,x),grid
title(‘x signal in time domain(distorted)’);
xlabel(‘Time’)
ylabel(‘Amplitude’)
图2:时域中信号失真前后图形
在时域中,图形发生了很大的变化:s信号幅度较小(虽然这两张图在视觉可能会给您一种x信号具有较高幅值的感觉)。如果您仔细看一下y轴的比例,就可以看出两者幅度的差异。对原由网于这一现象,您可能会想知道是应用了哪种滤波,以及是什么修改方式导致的这些系数值。
答案可以在频域中找到:
figure
s1 = abs(fft(s,NS));
subplot(2,1,1), plot((0:(NS-1))/NS*fe2, s1), grid
title(‘Single-Sided Amplitude Spectrum of s(t)’)
xlabel(‘Frequency (Hz)’)
ylabel(‘|s(k)|’)
x1 = abs(fft(x,NS));
subplot(2,1,2), plot((0:(NS-1))/NS*fe2, x1), grid
title(‘Single-Sided Amplitude Spectrum of x(t)’)
xlabel(‘Frequency (Hz)’)
ylabel(‘|X(k)|’)
我们应用傅里叶变换来得到等效频率。正如您在图3中看到的那样,y轴对称的中心点大约是采样率的1/2。
图3:频域中信号失真前后图形
这两个信号具有不同的频谱
• 顶部图像
• Y轴值约为800。
• 值达到2000 Hz后,几乎没有信号。
• 底部图像:
• Y轴值约为40。
• 值达到2000 Hz后,可以观察到仍有信号。
研究此频率范围内的样本点是很困难的。因此,让我们将目标锁定在2000 Hz左右处,对该范围内的幅值进行研究。
图4:2500Hz附近小范围频率内图像
如果我们仔细观察幅值变化,可以看出两个信号具有相同的形状,而它们在图3中看起来并不相似。上一张图像中的两个信号之所以看起来不同是因为它们的坐标轴比例设置不同。
从两个图中,我们可以观察到振幅降低了。可是我们还是不知道滤波器的频率响应是什么,以及它对我们的信号带来了其他什么变化。在这种情况下,我们使用Matlab对其进行绘制。
[h1,w1] = freqz(b,a,NS,fe2);
figure
plot(w1,abs(h1)), grid
xlabel(‘Frequency (Hz)’)
ylabel(‘Frequency response’)
图5:一个新型滤波器
这个新的滤波器称为带通滤波器。因为这是第一次使用该滤波器,所以在应用之前,我们先了解一下它的一些属性:
• 可以通过将低通滤波器电路和高通滤波器电路相连接来实现。
• 应用该滤波器时,滤波器通带中的信号保持不变,而在频带外部的频率分量将被衰减。
• 高通带和低通带上的分量将被衰减。
• 在我们的项目中,验证了2000 Hz的频率分量发生了衰减。
• 理想的带通滤波器具有平坦的通带,但在我们的应用中,如图4所示,出现了一个增益(也可能发生衰减)。我们只能在理论中获得理想的滤波器。
图6:带通滤波器
您可以看到,图6中的滤波器和图5中的滤波器具有相似的形状。因此,我们已经获得了一个新的滤波器。
步骤4:创建GUI
作为一个实用项目,我们接下来将会对自己的语音信号进行处理。对!这就是我们将要与Arduino相结合的地方。
图7:Arduino套件
在本项目中,我选择了带有MAX9812L放大器和驻极体麦克风的模块。该模块具有以下三个端子:
• VCC(2.7V至3.6V之间—由Arduino的3.3V引脚供电)
• GND(接地端—连接到Arduino接地端)
• OUT(本项目中连接到A0)
图7:Arduino套件
我们不打算使用Arduino IDE串行监视器,而是直接在Matlab中读取传感器值。
Arduino 代码:
void setup {
Serial.begin(9600);
}
void loop {
int sensorValue = analogRead(A0);
float voltage = sensorValue * (3.3 / 1023.0);
Serial.println(voltage);
}
我们还将使用Matlab来进行处理。为了处理语音信号,我们将创建一个图形用户界面。该图形用户界面中有两个按钮:
• 蓝色(start)– 用户开始语音记录
• 橙色(push button)– 用户停止通过连接到Arduino的麦克风进行录音(关闭串行传输)。
在该程序中创建GUI非常容易,因为您可以使用拖动功能来绘制连接点。首先,在命令窗口中输入guide。
图9:在Matlab中创建GUI
当您点击“Create New GUI(创建新GUI)”时,将会显示出来一个用户友好界面。Matlab GUI不像C#或其他语言那样需要较高的编程技能。在这里,您需要选择要添加的块,并对生成的代码进行修改。
图10:如何在Matlab中创建块
在左侧菜单中包含了用于您的GUI的不同指令。对于本项目来说,需要的元素不会超过三个,因为我们只是要对语音信号进行显示而已。因为我们希望在记录后可以使用数据,所以将创建一个包含录音内容的.csv文件,该文件可用于信号处理。
在我的GUI中,我使用了:
• 坐标轴;
• 2个按钮;
图11:GUI设计
该按钮的代码是根据按钮的规格来构建的。整个代码将被上传到GitHub上供您下载。
fid = fopen(‘signal.csv’,’w’)
S=1;
s = serial(‘COM9’);
set(s,’BaudRate’,9600);
fopen(s);
fprintf(s,’%s’,’S’);
图12:Matlab应用程序中的语音信号
如果您已经完成了这一步,那么恭喜您!到此为止,我们的数字信号处理系列教程已经结束了。我们介绍了有关信号处理的各种概念。这是一个非常具有挑战性的课题,所以如果现在没有对所有内容都了解得很清楚,也不要气馁!当您觉得在某些概念的理解上出现困难时,您可以从网上大量的资源中获取更多有关信息。随时欢迎您对我们的工作进行访问和评论,并与我们分享您的成果!
附件
• https://www.mathworks.com/help/signal/index.html
• https://dspguru.com/dsp/links/dsp-on-wikipedia/
• https://www.coursera.org/learn/dsp/home/welcome
•https://ocw.mit.edu/resources/res-6-008-digital-signal-processing-spring-2011/
• https://www.sp4comm.org/webversion.html
作者:Tiberia Todeila
Tiberia目前是罗马尼亚布加勒斯特理工大学电气工程学院的大四学生。她非常热衷于设计和开发让日常生活更轻松的智能家居设备。
- END -
关注@面包板社区
学习更多机器人、电子电气、电路、嵌入式技术
PLC最全编程算法
教程:打造自己的Arduino六足机器人
拆解一个电锤,看看内部长啥样?
雷达图分析:三种电机性能有何不同?
施耐德PLC内部拆解
动画图解常见串行通讯协议