• بازدید : 43 views
  • بدون نظر
این فایل در ۸۷صفحه قابل ویرایش تهیه شده وشامل موارد زیر است:

بازار ابزار استخراج داده ها از دو راه ابتدايي خود در حال ظهور مي‌باشد . بسياري از ابزارهايي كه در اينجا توضيح داده مي‌شوند ، در مرحلة اول انتشار مي‌باشند. 
موقعيت در بازار CRM كه عموماً بخشي از سيستم تجارت الكترونيكي در نظر گرفته مي‌شود ، پيچيده تر مي‌باشد و بنابراين با سرعت وب يا شبكه در حال حركت مي‌باشد. بازار CRM ، حتي بيشتر از بازار ابزار استخراج داده‌ها با چندين فروشنده كه بر تعريف خود بازار و موقعيت خود در اين بازار متمركزند ، توصيف مي‌گردد. 
بيائيد بازار استخراج داده ها را از نقطه نظر منحني اقتباسي تكنولوژي در نظر بگيريم ايمني به اقتباس كنندگان اوليه ، از تكنولوژي لبة يادگيري براي دستيابي به مزيت رقابتي استفاده مي‌كنند ؛ هنگاميكه تكنولوژي تكامل مي‌يابد ، شركتهاي بيشتري آن را اقتباس مي‌كنند ، و در يك حالت تجارت زماني و عادي درج مي‌نمايند . همچنين مناطق عملي بودن ابزاهاي استخراج داده ها بزرگتر و بزرگتر مي‌شوند. به عنوان مثال ، تكنولوژي وايت اوك ( يك شركت استخراج داده ها در مريلند)  از جانب كميسيون فدرال الكترون، مجوز فروش سيستم گچين ماينر Capain Miner را كسب كرده است كه بي نظمي‌در دخالتهاي سياسي فدرال را كشف مي‌كند . نورتل، يك بسته كشف كلاهبرداري را توسعه داده است به نام سوپر اسلوت فراود ادوايسور ، كه از تكنولوژيهاي شبكة عصبي استفاده مي‌كند . 
صنعت ابزار استخراج داده ها ، برخلاف تكنولوژيهاي استخراج داده ها ، در مرحلة عدم تكامل قرار دارد و مي‌كوشد تا بازار را تعيين نمايد . و وجودش را تائيد كند . به همين دليل است كه در مي‌يابيم بازار ابزارهاي استخراج داده ها تحت تاثير موارد زير قرار دارد: 
ادغام پيوسته و مداوم ابزارها با اتكاء به تكنولوژيهاي مكمل و به عنوان مثال OLAP  
ظهور كاربردهاي بسته بندي شدة عمودي و يا اجزاء استخراج داده ها براي توسعة كاربرد .
استراتژيهاي بسيار اقتباس شده شركت بين فروشندگان ابزار استخراج داده ها و فروشندگان تهيه كنندگان راه حل جامع و ادغام كننده هاي سيستم ها : فروشندگان  مقياس مؤسسه ، همانند IBM NCR ، اوراكل ، ميكروسافت ) به عنوان مثال ، اوراكل چندين شريك متعدد استخراج داده ها به عنوان بخشي از او را كل ويرهاوس اينتيشيتيو از جمله آنگاسن ديتا مايند ، ديتاپكيج اينفورميشن ديسكاوري ، SRA , SPSS اينترنشنال و تينكينگ ماشينز را انتخاب كرده است . 

اصول طبقه بندي ابزارهاي استخراج داده ها 
ما مي‌توانيم كل بازار ابزارهاي استخراج داده ها را به سه گروه اصلي تقسيم نمائيم ؛ ابزارهاي داراي هدف كلي ، ابزارهاي ادغام شدة استخراج داده ها DSSOLAP ، و ابزارهاي به سرعت در حال رشد و براي كاربرد.
ابزارهاي هدف كلي بخش بزرگتر و كامل تر بازار را اشغال مي‌كند . آنها بنا به تعريف و براي كاربرد نيستند و حوزه آنها از نظر ماهيت افقي است . اين ابزار شامل موارد زير مي‌شود . 
SAS اينترپراز ماينر
IBM اينتليجنت مايننر
يونيكا PRW
SPSS كلمنتين 
SGI ماين ست
اوراكل داروين
آنگاس نالج سيكر
بخش ابزار مركب يا اداغام شدة استخراج داده ها بر شرط تجاري بسيار واقعي و اجباري داشتن ابزار چند منظورة تقويت تصميم تاكيد مي‌كند كه گزارش مديريت ، پردازش تحليلي روي خط ، و قابيت هاي استخراج داده ها در يك قالب كاري عادي را فراهم مي‌كند . نمونه هاي اين ابزار هاي مركب شامل كاكنوس  سيناريو و بيزينس آبجكت مي‌شود. 
بخش ابزارهاي ويژة كاربرد ، به سرعت در حال حركت است ، و فروشندگان در اين فضا ، مي‌كوشند تا خود را با ارائة راه حلهاي تجاري به جاي جستجوي تكنولوژي براي يك راه حل ، از سابرين متمايز نمايند . حوزة اين ابزار ، بنا به تعريف از نظر ماهيت عمودي است . در بين اين ابزارها ، موارد زير قرار دارند:
KD1 ( متمركز بر خرده فروشي است )
حق انتخابها و انتخابها ( بر صنعت بيمه متمركز است )
HNC ( بر كشف كلاهبرداري متمركز است )
يونيكا مدل ۱ ( بر بازاريابي متمركز است )

ارزيابي ابزار : صفات و اسلوب شناسي ها
كل اين عوامل ارائه يك توصيف بهينه از ابزارهاي استخراج طولاني تر موجود را مشكل ساخته است . بنابراين . بطور كلي ابزارهاي استخراج داده ها را مي‌توان با استفاده از صفات زير ، توصيف نمود : 
تكامل محصول و ثبات و استحكام شركت . به دليل عدم تكامل كلي بازار تجاري براي ابزارهاي استخراج داده ها ، اين مقوله محصولاتي را توضيح مي‌دهد كه براي جنبش از چند سال وجود داشته اند. 
سكوها و معماري. سكوهاي متنوع از نظر تجاري موجود را تقويت كنيد ، مدل چند تأبيري مشتري / خادم را تقويت كنيد . هدف قابليت سنجش، دسترسي به سرعت نزديك به خطي و سنجش زمان اجرا ، به عنوان ميزان داده ها ( اندازة بانك اطلاعاتي ) ، تعداد متغيرها ، و تعداد كاربران متصل به هم مي‌باشد كه در حال رشد هستند . 
تداخلهاي داده ها ، قابليت ابزار براي دسترسي به بانكهاي اطلاعاتي ارتباطي ، فايلهاي يكنواخت و ساير فورمتها.
قابليتهاي استخراج داده ها از جمله تكنيكها ، الگوريتم ها و كاربردهاي تحليلي ،‌ تكنيكهاي استخراج داده ( ANN ، CART ، ايفاء قانون و غيره ) با تداخل عادي كاربر كه ابزار مي‌تواند آن را تقويت نمايد، توانايي ايجاد و مقايسة چندين مدل ؛ و توانايي براي تقويت تعدادي از انواع مختلف تجزيه و تحليل از جمله طبقه بندي ، پيشگويي و كشف اتحاد. 
ايجاد داده ها قابليت تغيير شكل و طبقه بندي متغيرهاي پيوسته ، ايجاد متغيرهاي جديد ، استفاده از تاريخها و زمان ، استفاده از ارزشهاي از دست رفته و غيره.
مدل (خصوصيت تفسير ، ارزيابي ، صف بندي) . اين مقوله ، ابزار را از نظر قابليت انجام كارهاي زير ، ارزيابي مي‌كند: 
شناسايي مدل بطور اتوماتيك يا دستي ، توسط كاربر
توضيح نتايج و تعريف مقايسهاي اعتمادي يعني احتمالات طبقه بندي ،‌ حدود اعتماد و غيره 
ارزيابي نتايج مدل با درجه و تناسب
گزارش دخالت و سهم  هر متغير در مدل ، گزارش درجة افزايش و غيره
صف بندي مدل براي امتياز بانكهاي اطلاعاتي منبع 
استخراج مقرارت از مدل 
دسته بندي قوانين استخراج شده در يك شكل استاندارد ( به عنوان مثال كد SQL، اظهارات روشي ) 
عملكرد
اعتبار پيشگويي اعتبار بر اساس نرخ خطاي نمونة پيشگويي مي‌باشد ؛ اعتبار مدل را مي‌توان با درجة افزايش اندازه گيري نمود. 
كارايي پردازش . اجزاي بهينة زمان اجراي الگوريتم ها 
تداخلهاي كاربر . اين مقوله در مي‌يابد آيا ابزار يك كاربر مبتدي و يا كارشناس را تقويت مي‌كند يا نه و موارد زير را تقويت مي‌نمايد: 
الگوهاي سنجش تجاري . قابليت ايجاد الگوهاي از قبل بسته بندي شده ، براي تقويت بسته هاي تجاري ويژه ( به عنوان مثلا بازاريابي هدف ، امتيازدهي اعتبار، كشف كلاهبرداري ).
تداخل متاديتا . قابليت تقويت وظيفة طراحي معنايي ؛ دستيابي به متاديتا براي كدگذاري جداول مقادير مقوله اي ، دستيابي به قوانين استخراج ، تغيير شكل و مهاجرت به تعريف ديدگاه تجاري خروجي مدل 
قابليت اداره
كنترل پيچيدگي . اين يكي از روشهاي اصلاح تصميم مدل است ، بنابراين مدل را بيشتر قابل اداره مي‌نمايد . به عنوان مثال ، استفاده از پارامترهاي بسيار آزاد منجر به تناسب بيش از حد مي‌گردد ( قبلاً بحث شد ) ؛ اين پيچيدگي را مي‌توان با زوال وزن ، كنترل نمود . الگوريتم هاي درخت تصميم CART از فاز شاخه زني يا ضريب براي كاهش پيچيدگي مدل درخت استفاده مي‌نمايند . 
سختي . اعتبار درخت و موجود بودن به قابليت يا بهبود سريع از يك نقطة ضعف . استفاده از اجزاء كليدي به منظور ادغام در قالب كاري مديريت سيستم ها ( به عنوان مثال BMCpatrol ، Tivolitme10 و غيره.)

عتیقه زیرخاکی گنج