(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال دانشگاه صنعتي شريف

ساخت وبلاگ

دانشكده مهندسي كامپيوتر
مرکز فناوری اطلاعات و ارتباطات پيشرفته
(DML) آزمايشگاه رسانه های ديجيتال
ديجيتال كردن صوت و تبديل نرخ نمونه برداري
دکتر حميدرضا ربيعی
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
١- مقدمه
در يك ميكروفون، امواج فشار صداي فيزيكي به سيگنالهاي الكتريكي متناظر با خود، به وسيله مبدلهاي آكوستيكي نظير ميكروفون يا
تبديل مي شوند. خروجي الكتريكي مبدل يك سيگنال آنالوگ ناميده مي شود، زيرا سيگنال الكتريكي Phonograph cartridge
مشابه الگوي فشار موج صوتي است كه آن را بوجود آورده است. سيگنالهاي صوت به صورت الگوهاي موج دوبعدي مي باشند كه
نشان دهندة مسير زمان هستند، شكل ١، شكل موج آنالوگ از يك سري موجهاي x نشان دهندة شدت يا دامنه و محور y محور
± را نشان مي دهد. اين سري موجها به وسيله ميكروفون و تقويت كننده به ولتاژ آنالوگ با حداكثر دامنة 0.5 chime صوت از يك
تبديل شده اند. (VPP ولت (دامنة قله به قله يا
شکل ١- شكل موج معمول صوت
فركانس يك موج به وسيله زمان سپري شده بين تكرارها تعيين مي شود كه طول موج ناميده مي شود. بيشتر موجهاي صوت دقيقًا
تكرار نمي شوند اما مي توان يك الگوي مشخص در شكل موجي كه توسط بيشتر سازهاي موسيقي ايجاد مي شود، مشاهده كرد. طول
كه با واحد هرتز اندازه گيري مي شود ،F، ، در مقياس ميلي ثانيه يا ميكروثانيه بيان مي شود. فركانس l موج يك صوت الكتريكي،
l مي باشد، يعني l (تعداد دور در هر ثانيه) معكوس
= 1
. F
صداي بشر يا صداهاي توليد شده به وسيله سازهاي موسيقي م يتوانند به يك موج پايه و موجهاي متعدد الحاقي ديگر تقسيم شوند.
ها موجهاي فركانس بالاترمی باشند و با Overton . ناميده مي شوند overtone ، موجهاي الحاقي كه به موج پايه اعمال شده اند
فركانس هايي كه ضرايبي از موج پايه مي باشند (هارمونيك ها) به صدا، مشخصات يك صوت بشري يا صوت سازهاي موسيقي را
مي بخشند. هنگامي كه يك سيگنال صوت به سيگنالهاي ديجيتال تبديل مي شود، نرخ نمونه برداري موردنياز بستگي به فركانسهاي
هاي موجود در سيگنال دارد. overtone
در اين آزمايش شما امكان بازي با سيگنالهاي نمونه برداري شده در نرخ هاي متفاوت نمونه برداري را داريد، كه كيفيت هاي مختلفي
از صوت را عرضه مي كنند.
٢- تئوري
١- نمونه برداري يك سيگنال پيوسته و تئوري نمونه برداري نايكوئيست -٢
سيگنالهاي صوت از نوع سيگنالهاي پيوسته (آنالوگ) هستند كه به تدريج با نقصان يافتن منبع صدا، افت دامنه پيدا م يكنند. از سوي
از بيتهاي صفر و يك. داده هاي ديجيتال stream ديگر، كامپيوترها، داده هاي خود را به صورت ديجيتال ذخيره مي كنند: يك رشته
طبيعتًا گسسته هستند زيرا مقدار ” 0“ يا ” 1“ دادة ديجيتال فقط در يك لحظة مشخص معتبر مي باشد. بنابراين، سيگنال صوت آنالوگ
كه پيوسته است بايد به فرم ديجيتالي ناپيوسته تبديل شود تا كامپيوتر توانايي ذخيره يا پردازش صوت را داشته باشد. البته دادة ديجيتال
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
دوباره بايد به فرم آنالوگ تبديل شود تا از طريق يك سيستم صوتي قابل شنيدن باشد. تبديل دو طرفه بين سيگنالهاي آنالوگ و
و كارتهاي صدا مي باشد. adapter ديجيتال، عمليات اوليه تمام كارتهاي
١- نمونه برداري تناوبي و تبديل آنالوگ به ديجيتال -١-٢
روش معمول نمايش يك سيگنال زمان – گسسته از يك سيگنال زمان – پيوسته، نمونه برداري متناوب (پريوديك) است كه در آن
مطابق رابطه زير بدست مي آيد. xc(t) از يك سيگنال زمان پيوسته x[n] يك دنباله از نمونه هاي
(١-٢)
ايده آل (A/D) شکل ٢- يك مبدل آنالوگ به ديجيتال
T ، تناوب نمونه برداري و معكوس آن T ،(١- در رابطة ( ٢
1
fs ، فركانس نمونه برداري بر حسب نمونه بر ثانيه كه معمو ً لا بر حسب =
١) را به عنوان يك مبدل ايده آل پيوسته – به – گسسته - نمايش داده مي شود، می باشند. ما يك سيستم را كه رابطة ( ٢ (Hz) هرتز
عملي مي كند در شكل ٢ نشان داده ايم. براي ذخيرة مقادير نمونه برداري شده توسط كامپيوتر با دقت محدود، مقادير پيوسته (C/D)
بايد به يك سري مقادير از پيش تعيين شده كوانتيزه شوند. عمليات نمونه برداري و كوانتيزاسيون دقيقًا همان عملياتي است كه در
مبدل آنالوگ – به – ديجيتال، يا ديجيتال – به – آنالوگ، به صورت برعكس، صورت مي گيرد. بيشتر كارتهاي صدا قابليت ذخيره
صدا را هم به صورت ٨ بيتي و هم ١٦ بيتي، براي كيفيت هاي بالاتر صوتي دارند.
٢- تئوري نمونه برداري نايكوئيست -١-٢
تئوري نمونه برداري به ما مي گويد كه چه اندازه نمونه برداري ما مي تواند سريع باشد تا نمايش بهتري از سيگنال اوليه داشته باشيم.
مي دانيم كه اگر يك سيگنال تغييرات خيلي سريع داشته باشد، ما هم بايد در فاصله هاي نزديكتري نمونه برداري كنيم تا هيچ تغيير
مياني را از دست ندهيم. يك مثال خوب، نمايش سهام بورس بر حسب نمايش وضع هوا است. از آنجا كه تغييرات بورس بسيار
سريع است، به طور معمول بايد هرچند دقيقه يكبار اعلام شود، از طرف ديگر، دربارة وضع هوا، نمايش اين تغييرات در هر ساعت
كافي خواهد بود.
مي اندازيم كه چه اندازه دقيق بايد آن را تعيين كرد. T حالا، نگاهي به تئوري تناوب
تبديل فوريه آن است كه Xc ( jW) يك سيگنال با پهناي باند محدود و xc(t) تئوري نمونه برداري نايكوئيست: در نظر بگيريد كه
شرط زير را برآورده مي كند.
(٢-٢)
بيان مي شود به شرطي كه تناوب نمونه برداري آن يا n = 0,±1,±2,..., x[n] = xc (nT) منحصرًا توسط نمونه هاي xc(t) پس
شرط زير را برآورده كند. Ws فركانس نمونه برداري
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
(٣-٢)
2 كه بايد از WN نتيجه فوق ابتدا توسط نايكوئيست بدست آمد كه به نام تئوري نمونه برداري نايكوئيست مشهور شد. فركانس
تبديل فوريه X(ejw) ، فركانس نمونه برداري كوچكتر باشد، نرخ نمونه برداري نايكوئيست ناميده مي شود. براي اثبات تئوري فوق
بدست مي آوريم. ،xc(t) تبديل فوريه پيوسته ، Xc ( jW) را بر حسب x[n] زمان – گسسته دنبالة
به همين منظور سيگنال قطار ضربه زير را در نظر مي گيريم.
(٤-٢)
به صورت زير مي باشد: xs(t) مي توان نشان داد كه تبديل فوريه
(٥-٢)
با استفاده از تعريف
(٦-٢)
(٧-٢)
مشاهده مي شود
(٨-٢)
٨) نتيجه مي گيريم كه - ٥) و ( ٢ - از روابط ( ٢
(٩-٢)
مي باشد. مقياس فركانس Xc ( jW) مجموع ترمهاي مقياس بندي شده و شيفت يافتة X(ejw) ٩) مشاهه مي شود كه - از رابطه ( ٢
توسط
T
w تعيين مي شود، در حالي كه شيفت ها برابر با ضرايب فركانس نمونه برداري W =
T
2
s W = p مي باشند.
٣- بازسازي يك سيگنال باند محدود از نمونه هايش (تبديل ديجيتال به آنالوگ) -١-٢
كه ، xc ( jW) = براي 0 W > WN از شکل ٥، اگر سيگنال اوليه باند محدود باشد، يعني
2
s
N
W £ W را Xc ( jW) ، مي توان
را بوجود آوريم. xs(t) بدست آورد. به طور دقيقتر ابتدا مي توانيم سيگنال قطار ضربه X(jw) دوباره از
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
(١٠-۲)
2 T سپس مي توانيم يك فيلتر ايده آل پايين گذر را با فركانس قطع
s
c
W = W = p اعمال كنيم. xs(t) به
(١١-٢)
است. يعني: Xc ( jW) پهناي باند محدود باشد آنگاه سيگنال فيلتر شدة تبديل فوريه آن دقيقًا برابر Xc ( jW) اگر
به صورت زير مي باشد. hr (t) در حوزه زمان، فيلتر بازسازي ايده آل
(۱۲-٢)
سيگنال بازسازي شده به صورت زير است
(١٣-٢)
شکل ٣، نمودار بلوكي اين فرآيند بازسازي را نشان مي دهد.
براي ،(Ws > 2WN از نتيجه فوق، نمونه هاي يك سيگنال باند محدود زمان پيوسته كه با فركانس كافي نمونه برداري شده اند (يعني
نمايش سيگنال اصلي كافي هستند پس سيگنال اصلي از روي نمونه ها و دانستن پريود نمونه برداري قابل بازسازي است.
در عمل، فيلتر ايده آل پايين گذر قابل پياده سازي نيست و ما بايد تقريب بزنيم. علاوه بر اين، يك سيگنال واقعي ممكن است پهناي
باند زيادي داشته باشد كه توسط سيستم نمونه برداري قابل اجرا نباشد. بنابراين در عمل بايد ابتدا يك پيش فيلتر پايين گذر و با
فركانس قطع 2
s
c
W £ W را اعمال كرد ( 2
s
N
W £ W .(
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
شکل ٣- (الف) يك سيستم بازسازي سيگنال باند محدود ايده آل (ب) پاسخ فركانسي يك فيلتر بازسازي ايده آل (ج) پاسخ
ضربه به يك فيلتر بازسازي ايده آل
٢- نمونه برداري کاهشی -٢
نرخ نمونه برداري يك دنباله مي تواند با نمونه برداري از آن كاهش يابد.
xd[n] = x[nM] = xc(nMT) (١٤-٢)
xc(t) از سوي T¢ = MT را مي توان به صورت مستقيم با تناوب نمونه بردار يك xd[n] ١٤ ) مشاهده مي شود كه - در رابطة ( ٢
اگر xc(t) يك نمايش دقيق از xd[n] ، آنگاه | W |> WN براي Xc ( jW) = بدست آورد. به علاوه، اگر 0
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
s s N 2
M
1
T
2 كاهش داد اگر نرخ نمونه برداري اوليه M باشد. بنابراين، نرخ نمونه برداري را مي توان با ضريب W = p = W > W
برابر نرخ نايكوئيست باشد . به طور كلي، براي جلوگيري از تداخل، پهناي باند دنباله ابتدا بايد به وسيله فيلتر زمان – M حداقل
برابر كاهش يابد. نمودار بلوكي يك نمونه بردار – كاهشي در شکل ٤ نشان داده شده است. M گسسته تا
بايد يك فيلتر H(ejw) يك پيش فيلتر است. در حالت ايده آل H(ejw) كه در آن ،M شکل ٤- نمونه برداري کاهشی با ضريب
c M با فركانس قطع
W = p باشد.
را به ياد آوريم. x[n]=xc(nT) ابتدا بايد تبديل فوريه زمان گسسته ،xd[n] و x[n] براي تعيين رابطه بين تبديل فوريه
(١٥-٢)
به صورت زير مي باشد. T¢ = MT يا xd[n]=x[nw]=xc(nT) مشابه رابطه بالا، تبديل فوريه زمان – گسسته
(١٦-٢)
١٦ ) به صورت زير بيان مي شود. - در رابطة ( ٢ r انديس جمع
r = i + BM (١٧-٢)
0 است. ۱۷ ) را مي توان به صورت زير بيان كرد. - است، حالا معادله ( ٢ + ¥ تا - ¥ هنوز يك عدد صحيح در دامنة r واضح است كه
(١٨-٢)
١٥ ) قابل جايگزيني است. - ١٨ ) از رابطة ( ٢ - عبارت درون كروشه در رابطة ( ٢
(١٩-٢)
١٨ ) را به صورت زير بازنويسي كنيم. - بنابراين ما مي توانيم رابطة ( ٢
(٢٠-٢)
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
نمونه ،M= نمايش داده شده است. مي توان مشاهده كرد زماني كه 2 M= و در شكل ( ٦) براي 3 M= كه در شكل ( ٥) براي 2
همپوشاني بين طيفهاي تكرار شد (همان ،M= برداري کاهشی باعث همپوشاني طيف سيگنال اوليه نمي شود. از طرف ديگر، وقتي 3
تداخل) رخ مي دهد. براي جلوگيري از تداخل پيش فيلتر كردن قبل از نمونه برداري کاهشی الزامي است.
(M= شکل ٥- نمايش حوزه فركانس در نمونه برداري كاهشي ( 2
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
(M= شکل ٦- نمايش حوزه فركانس در نمونه برداري كاهشي ( 2
بدون پيش فيلتر كردن، بنابراين سيگنال نمونه برداري شده كاهشي تداخل دارد. (a)-(c)
نمونه برداري كاهشي با پيش فيلتر كردن براي جلوگيري از تداخل. (d)-(f)
٣- نمونه برداري افزايشي سيگنالهاي ديجيتالي -٢
كاهش نرخ نمونه برداري يك سيگنال گسسته – زمان با ضريب صحيح شامل نمونه برداري يك دنباله، مشابه نمونه برداري سيگنال
سر و كار دارد. براي مشاهده اين D/C پيوسته مي باشد. جاي تعجب نيست كه افزايش نرخ نمونه برداري نيز با عمليات مشابه تبديل
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
افزايش دهيم، در نظر بگيريد. اگر ما سيگنال پيوسته L را كه مي خواهيم نرخ نمونه برداري آن را با ضريب x[n] مطلب، سيگنال
را در نظر بگيريم هدف بدست آوردن نمونه هاي xc(t)
(٢١-٢)
(٢٢-٢)
از نمونه هاي دنبالة ما عمليات افزايش نرخ نمونه برداري را نمونه برداري افزايشي مي ناميم.
xi[n] = x 



 = 



L
nT
x
L
n
c , n = 0,±L,±2L,... (۲۳ -٢)
شکل: ۷- پروسة نمونه برداري افزايشي (درون يابي)
با استفاده از پردازش زمان – گسسته نشان مي دهد. سيستم سمت چپ x[n] از xi[n] شکل ٧- يك سيستم را براي بدست آوردن
يك افزايندة نرخ نمونه برداري يا به طور ساده يك افزاينده ناميده مي شود.
خروجي آن به صورت زير مي باشد.
(٢٤-٢)
يا به بيان ديگر
(٢٥-٢)
مي تواند به صورت زير بيان شود. xe[n] تبديل فوريه
(٢٦-٢)
احتياج به اعمال يك فيلتر ايده ال ،xe[n] از xi[n] نمايش داه شده است. براي بدست آوردن (c )- و ٨ (b)- رابطه بالا در شکل ٨
پائين گذر با فركانس قطع
L c
W = p مشاهده مي شود) (e),(d)- داريم (كه در شكل ٨ L و با بهرة
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
شکل ٨- نمايش دامنه فركانس نمونه برداري افزايشي
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
٣- آزمايش ها
١- نمونه برداري صوت در فركانسهاي متفاوت -٣
در اين تجربه، شما صداي خود را ضبط خواهيد كرد،
١) صداي خود را ضبط كنيد.
در كارت صدا متصل شده است، در سمت “MIC-in” الف) مطمئن شويد كه ارتباط ميكروفون درست است يعني ميكروفون به
پشت كامپيوتر.
كليك كنيد. file-properties-convert را باز كنيد. ابتدا روي “sound recorder” ب) سه پنجره
در rec8.wav 8000 را انتخاب كنيد. ٥ ثانيه از صداي خود را ضبط كنيد و تحت عنوان فايل Hz,8bit, Mono 8kB/s سپس
آدرس خود ذخيره كنيد.
22,050Hz,8bit, Mono 11025 را از 22 Hz,8Bit و Mono 11 kB/s ث) براي دومين و سومين ضبط صدا از فورمت
ذخيره كنيد. rec22.wav و recll.wav استفاده كنيد: فايلها را تحت عنوان kB/s
ت) صداها را يكي پس از ديگري گوش داده و كيفيت آنها را مقايسه كنيد:
ضبط كنيد. CD-Rom ٢) صدا را از
44 در k 22 و k 8 و k را در فركانسهاي CD پخش كنيد. پنج ثانيه از صداي CD player صوتي را با استفاده از CD يك
در آدرس خود ذخيره كنيد. cd44.wav و cd22.wav cd11.wav 8 ضبط كنيد. فايلها را به فرمت bits/sample
را براي كامپيوتر خود ضبط كنيد. MIDI ٣) صداي
44 ضبط k 22 و k 11 و k را در فركانسهاي MIDI پخش كنيد. ٥ ثانيه از موسيقي media player را با استفاده از MIDI فايل
.midi11.wav كنيد. سپس فايلها را تحت عنوان
در آدرس خود ذخيره كنيد. midi44.wav و Midi22.wav
٤- حالا دربارة كيفيت صدا از منابع و فركانسهاي نمونه برداري مختلف نظر دهيد.
16 تكرار كنيد. bit/sample 8 به bit/sample ٥- مراحل ١ تا ٤ را با تغيير
MATLAB ٢- پردازش صوت با استفاده از -٣
براي حل مسأله داريد. MATLAB در اين آزمايش، شما احتياج به نوشتن برنامه
22 و ٨ بيتي را در نظر بگيريد. فركانس نمونه برداري آن را به نصف برسانيد( بدون KHz ١- يك سيگنال نمونه برداري شده در
پيش فيلتر كردن) و سپس با استفاده از يك فيلتر درون يابي خطي آن را دوباره به نرخ نمونه برداري سيگنال اوليه برسانيد.
٢- طيف سيگنالهاي نمونه برداري شده افزايشي و كاهشي را نمايش دهيد و سپس آنها را با سيگنال اوليه مقايسه كنيد. خطاي مربع
و x(n) بين دو سيگنال MSE . ٢٢ و سيگنال بازسازي شده را محاسبه كنيد KHz بين سيگنال اوليه در فركانس (MSE) ميانگين
به صورت زير محاسبه مي شود. N با طول y(n)
Σ=
= -
N
n 1
MSE [x(n) y(n)]2 / N
٣- مراحل ١ و ٢ را براي موارد زير تكرار كنيد.
الف) يك فيلتر ميانگين (شما مي توانيد طول فيلتر ميانگين را انتخاب كنيد) براي پيش فيلتر كردن.
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
براي درون يابي استفاده كنيد. “interp()” استفاده كنيد تا فيلتر بهتري طراحي كنيد. از تابع MATLAB در “FIR ب) از تابع ” 1
طولهاي متفاوت براي فيلتردرون يابي استفاده كنيد. طيف فيلترهاي پيش و پس پردازش را علاوه بر سيگنالهاي نمونه برداري شده
كاهشي يا افزايشي نمايش دهيد.
11 تكرار كنيد (اختياري) KHz ٤- مراحل ۱ تا ٣ را براي سيگنال نمونه برداري شده در
٥- تمام نتايج را چاپ كنيد.
شما بايد قادر .(sp.m,sp1.m, spfilter.m) . آورده شده است Appendix A در MATLAB براي موارد ١ و ٢، سه نمونه متن
conv( ) به وسيله يك فيلتري توسط تابع x( ) باشيد تا بقيه موارد را با بهبود اين متنها انجام دهيد. راهنمايي: فيلتر كردن يك دنبالة
به طور خلاصه، شما help conv. انجام مي شود. شما مي توانيد از دستور زير براي شناخت يك تابع استفاده كنيد. به عنوان مثال
را بهبود دهيد تا موارد زير را عملي سازند. Appendix A بايد برنامه هاي
الف) بدون پيش فيلتر كردن، نمونه برداري كاهشي با نرخ ٢، درون يابي دوباره و برگشت به اندازه اوليه
ب) فيلتر ميانگين، نمونه برداري كاهشي با نرخ ٢، و برگشت به اندازة اوليه
نمونه برداري كاهشي با نرخ ٢، و برگشت به اندازة اوليه ،fir ج) ( ) 1
٤- گزارش
فايلها و فيلترها و شكلهاي خروجي باشد. پرسشهاي زير را در گزارش خود پاسخ دهيد. تمامي فايل هاي m گزارش شما بايد شامل
([email protected]) . بفرستيد TA e-mail گزارش را به صورت يك فايل فشرده به آدرس
8 است، سيگنال نمونه برداري شده KHz و فركانس نمونه برداري f=6KHz است زماني كه sin(2pft) ١) اگر سيگنال ورودي
4 استفاده مي كند چه خواهد بود؟ (مسئله را KHz چه خواهد بود؟ سيگنال بازسازي شده كه از فيلتر پايين گذر با فركانس قطع
بررسي كرده و تمام مراحل آن را در گزارش خود بنويسيد)
متفاوت نظر دهيد. دربارة تفاوت صوت و bits/sample ٢) درباره كيفيت فايلهاي نمونه برداري شده در نرخهاي نمونه برداري و
گفتار در نرخهاي نمونه برداري مختلف بحث كنيد.
٣) صداي درون يابي شده بعد از نمونه برداري كاهشي با نرخ ٢ را با سيگنال نمونه برداري شده كاهشي و سيگنال اصلي مقايسه كنيد.
توضيح دهيد كه چرا سيگنالهای بازسازي شده در بعضي موارد بهتر هستند.
٥- مراجع
[1]. The Math Works Inc., Matlab User’s Guide, 1993, MATLAB USERS’S GUIDE, 1993.
[2]. The Math Works Inc., MATLAB REFRENCE GUIDE, 1992.
[3]. Wilsky and Openheim, Signals & Systems, Chapter 8.
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال
(DML) دانشگاه صنعتی شريف، آزمايشگاه رسانه های ديجيتال

وایرکات ) Wire cut )...
ما را در سایت وایرکات ) Wire cut ) دنبال می کنید

برچسب : نویسنده : paryaarang بازدید : 160 تاريخ : چهارشنبه 11 ارديبهشت 1398 ساعت: 22:31