خانه / داده کاوی

داده کاوی

روش TF-IDF

مقدمه بسم الله الرحمن الرحیم با توجه به گسترش متون و مستندات الکترونیکی فارسی ، استفاده از روشی کارآمد جهت بازیابی اطلاعات ضروریست. برای بازیابی اطلاعات ، پی بردن به مفهوم اصلی متن ،رده بندی متون و یافتن کلمات مناسب برای جست و جو و مقالات ؛ استخراج کلمات کلیدی …

ادامه »

چه طور در کیک استارتر موفق شویم؟

تمام کسانی که به دنبال جذب سرمایه برای پروژه‌های خلاقانه و جاه طلبانه‌شان بوده‌اند، حتماً نامwww.kickstarter.com  را شنیده‌اند. سایتی غیر ایرانی که از سال ۲۰۰۹ شروع به فعالیت کرده است و در کمتر از ۶ سال، توانسته ده میلیون نفر را برای حمایت از ۱۰۰,۰۰۰ (صد هزار) پروژه پیشنهادی جذب …

ادامه »

تست chi-Square

     تست chi-Square این تست مشابه تست های دیگر آماری است که میزان ارتباط یا وابستگی بین متغیرها را اندازه گیری می کنند. همچنین می تواند برای تست وابستگی بین یک یا چند گروه نیز بکار رود که این کار را با مقایسهء تعداد واقعی نمونه های (مشاهده شده) در …

ادامه »

روش های موجود برای ممانعت از اورفیتینگ

معمولاً از قبل نمی دانیم که چه نمونه هایی نامربوط هستند و این ممکن است که به نوع و زمینهء داده ها برگردد، اما می توان از روشهای آماری ساده برای هشدار در زمان وقوع اورفیتینگ استفاده کرد مانند (تست chi-Squared). روش های بکار رفته برای ممانعت از اورفیتینگ، عموماً …

ادامه »

یادگیری تقویتی

حیوانات ، انسان ها ، اتومات ها و .. از خود رفتار های مختلفی در محیطی که آن ها را احاطه کرده ، در شرایط مختلف  ، از خود نشان می دهند. آن ها کارهای مختلفی را به عنوان باز خورد در جواب ورودی هایی که از محیط می گیرند …

ادامه »

چرا استفاده از تابع فعالسازی Relu به جای sigmoid در شبکه های عمیق رایج است؟ چه مزایایی دارد؟

مزایا: – تنها 50 درصد مواقع این تابع فعال می‌شود و در نتیجه از لحاظ پردازشی صرفه جویی میشود. – جلوی انفجار گرادیان یا محو شدن آن را میگیرد. (عجب ترجمه ای!) – با یافته های بیولوژیکی توسط نوروساینتیست ها مطابقت بیشتری دارد (علوم شناختی) #ReLU provides some important benefits …

ادامه »

مزیت داده کاوی با استفاده از هوش مصنوعی در مقایسه با روش های آماری

در جایی پایه و اساس Data mining به دو مقوله آمار و هوش مصنوعی تقسیم شده است که روشهای مصنوعی به عنوان روشهای یادگیری ماشین در نظر گرفته می شوند. فرق اساسی بین روشهای آماری و روشهای یادگیری ماشین[۱] بر اساس فرضها و یا طبیعت داده هایی که پردازش می …

ادامه »

معرفی ۱۱ ابزار آنلاین برای یادگیری داده کاوی

افرادی که قصد دارند دانشمند داده شوند در ابتدا با مشکلات فروانی روبرو خواهند شد یکی از این مشکلات نحوه آموزش این علم است، در حال حاضر آموزشگاه خاصی که به طور تخصصی در این زمینه کار کند، وجود ندارد اما یک خبر خوب برای این دسته از افراد داریم …

ادامه »

خوشه‎بندی در بیگ دیتا

چکيده مسئله پردازش و تحلیل داده‌های حجیم به لطف فراهم شدن امکانات آن بشدت مورد توجه است. داده‏هاي حجیم، اصطلاحی براي مجموعه‎ داده‎های بسیار بزرگ است که از نظر ساختار، پیچیدگی و منابع تولیـد بسـیار متنـوع هستند و ذخیره و تحلیل آنها کار پیچیده‎اي است. با رشد روزافزون سیستم‎های کامپیوتری …

ادامه »