ویژگیهای طیفی در برابر طیفی - زمانی برای تشخیص رخدادهای صوتی
SPECTRAL VS SPECTRO-TEMPORAL FEATURES FOR ACOUSTIC EVENT DETECTION
مشخصات کلی
سال انتشار | 2011 |
کد مقاله | 1401 |
فرمت فایل ترجمه | Word |
تعداد صفحات ترجمه | 9 |
نام مجله | IEEE Workshop on Applications of Signal Processing to Audio and Acoustics |
نشریه | IEEE |
درج جداول و شکل ها در ترجمه | انجام شده است |
جداول داخل مقاله | ترجمه شده است |
چکیده فارسی
تشخیص خودکار انواع متفاوت رخدادهای صوتی یک مسئله جالب در پردازش موسیقی متن است. رویکردهای معمولی مسئله از خصیصه های طیفی کوتاه مدت برای تشریح سیگنالهای صوتی، با مدلسازی اضافی بر بافتزمانی در رخدادها استفادهمیکنند. ما یک رویکرد را برای تشخیص و مدلسازی رخدادهای صوتی که به طور مستقیم مفاهیم موقتی زمانی را، با استفاده از فاکتور گیری ماتریس نامنفی (NMF) حلقوی شرح میدهد بیان کردیم. NMF برای یافتن تجزیه براساس بخشهای داده ای سودمند است، در اینجا برای کشف یک مجموعه از پچهای طیفی زمانی براساس بهترین تشریح داده، با پچهای متناظر با ساختار رویدادی کشف شدهاست. ما خصوصیات را از فعالسازی این پچهای پایه استنتاج میکنیم، و تشخیص رویداد را برروی یک پایگاهداده شامل 16 کلاس از بخش رویدادهای صوتی جلسات اجرا میکنیم. ما رویکرد خود را با یک مبنا با استفاده از خصیصه ضریب پیوسته فرکانس مل کوتاه مدت استاندارد (MFCC) مقایسه میکنیم. شرح میدهیم که سیستمهای مبتنی بر رویداد در حضور نویزهای اضافه شده نسبت به سیستمهای مبتنی بر MFCC مقاومتر است، و ترکیبات آن از دو سیستم حتی بهتر از حالت مجزا اجرا میشود.
چکیده لاتین
Automatic detection of different types of acoustic events is an interesting problem in soundtrack processing. Typical approaches to the problem use short-term spectral features to describe the audio signal, with additional modeling on top to take temporal context into account. We propose an approach to detecting and modeling acoustic events that directly describes temporal context, using convolutive non-negative matrix factorization (NMF). NMF is useful for finding parts-based decompositions of data; here it is used to discover a set of spectro-temporal patch bases that best describe the data, with the patches corresponding to event-like structures. We derive features from the activations of these patch bases, and perform event detection on a database consisting of 16 classes of meeting-room acoustic events. We compare our approach with a baseline using standard short-term mel frequency cepstral coefficient (MFCC) features. We demonstrate that the event-based system is more robust in the presence of added noise than the MFCC-based system, and that a combination of the two systems performs even better than either individually
خرید و دانلود ترجمه این مقاله:
جهت خرید این مقاله ابتدا روی لینک زیر کلیک کنید، به صفحه ای وارد می شوید که باید نام و ایمیل خود را وارد کنید و پس از آن روی دکمه خرید و پرداخت کلیک نمایید، پس از پرداخت بلافاصله به سایت بازگشته و می توانید فایل خود را دانلود کنید، همچنین لینک دانلود به ایمیل شما نیز ارسال خواهد شد.
هیچ دیدگاهی برای این مقاله ثبت نشده است
دیدگاه ها