ارزیابی الگوریتم های طبقه بندی رفتار مشتری بانکی تحت سیستم پردازش داده های Apache Spark
Evaluation of classification algorithms for banking customer’s behavior under Apache Spark Data Processing System
مشخصات کلی
سال انتشار | 2017 |
کد مقاله | 4060 |
فرمت فایل ترجمه | Word |
تعداد صفحات ترجمه | 9 |
نام مجله | Procedia Computer Science |
نشریه | ScienceDirect |
درج جداول و شکل ها در ترجمه | انجام شده است |
جداول داخل مقاله | ترجمه شده است |
چکیده فارسی
برای تجزیه و تحلیل، طبقه بندی یا پیش بینی داده ها، می توان از الگوریتم های طبقه بندی مختلفی استفاده کرد. این الگوریتم ها در عملکرد و نتایج آنها متفاوت می باشند. بنابراین، برای انتخاب بهترین رویکرد، مطالعات مقایسه ای نیاز به ارائه مناسب ترین روش برای استفاده در حوزه خاص دارد. در این مقاله، یک مطالعه مقایسه ای بین دو تکنیک طبقه بندی یعنی Bayes Naive NB و ماشین بردار پشتیبانی (SVM)، یادگیری ماشین (MLIiB) تحت سیستم پردازش داده های Apache Spark ارائه شده است. مقایسه پس از اعمال دو طبقه بندی در یک مجموعه داده شامل اطلاعات شخصی و رفتاری مشتریان در Santander بانک اسپانیا انجام می شود. مجموعه داده شامل مجموعه آموزشی با بیش از 13 میلیون رکورد و یک مجموعه تست حدود 1 میلیون رکورد است. برای کاربرد درست این دو طبقه بندی در مجموعه داده ها، یک مرحله قبل از پردازش برای مرتب کردن و آماده سازی داده ها مورد استفاده قرار می گرفت. نتایج تجربی نشان می دهد که Bayes Na ve ماشین بردار پشتیبانی را در شرایط دقیق، فراخوان و اندازه گیری F را برطرف می کند.
چکیده لاتین
Many different classification algorithms could be used in order to analyze, classify or predict data. These algorithms differ in their performance and results. Therefore, in order to select the best approach, a comparison studies required to present the most appropriate approach to be used in a certain domain. This paper presents a comparative study between two classification techniques namely, Naïve Bayes (NB) and the Support Vector Machine (SVM), of the Machine Learning Library (MLlib) under the Apache Spark Data processing System. The comparison is conducted after applying the two classifiers on a dataset consisting of customer’s personal and behavioral information in Santander Bank in Spain. The dataset contains: a training set of more than 13 million records and a testing set of about 1 million records. To properly apply these two classifiers on the dataset, a preprocessing step was performed to clean and prepare data to be used. Experimental results show that Naïve Bayes overcomes Support Vector Machine in term of precision, recall and F-measure.
خرید و دانلود ترجمه این مقاله:
جهت خرید این مقاله ابتدا روی لینک زیر کلیک کنید، به صفحه ای وارد می شوید که باید نام و ایمیل خود را وارد کنید و پس از آن روی دکمه خرید و پرداخت کلیک نمایید، پس از پرداخت بلافاصله به سایت بازگشته و می توانید فایل خود را دانلود کنید، همچنین لینک دانلود به ایمیل شما نیز ارسال خواهد شد.
هیچ دیدگاهی برای این مقاله ثبت نشده است
دیدگاه ها