خانه / دیتا ست

دیتا ست

مجموعه داده بیمارستان دیابت 130 ایالات متحده برای سال 1999-2008

  مجموعه داده  بیمارستان دیابت 130 ایالات متحده برای سال 1999-2008   مجموعه دادهها ویژگی ها: چند متغیره ویژگیویژگی ها: Integer وظایفمرتبط: طبقه بندی،خوشه بندی تعدادی از نمونه های: 100000 تعدادویژگیها: 55 از دست رفتن ارزش؟ yes محاسبه: زندگی تاریخاهدا: 2014-05-03     اطلاعات داده: مجموعه داده های نشان دهنده …

ادامه »

دیتاست کاملی از اخبار فارسی

دیتاست ها(مجموعه داده) اخبار فارسی شامل بیش از یک صد هزار خبر خبرگزاری ایسنا است. این مجموعه داده شامل تیتر اخبار و متن اخبار است.  فرمت این مجموعه داده پایگاه داده اکسس است. این مجموعه داده برای کسانی که به دنبال متن کاوی از اخبار فارسی هستند بسیار مفید است. …

ادامه »

مجموعه دیتاست همشهری

مجموعه همشهری پیکره‌ای است حاوی ۳۱۸ هزار سند مربوط به اخبار سال‌های ۱۳۷۵ تا ۱۳۸۶ که با خزش (Crawl) وب‌سایت همشهری و چندین مرحله پیش‌پردازش و برچسب‌گذاری حاصل آمده است. همه اسناد مجموعه همشهری دارای برچسب «Cat» هستند که نشان می‌دهد هر سند در چه رده‌ای است (اقتصادی، سیاسی و…). نسخۀ …

ادامه »

دیتاست های کاملی در حوزه های مختلف برای داده کاوی

AssetMacro, historical data of Macroeconomic Indicators and Market Data. Awesome Public Datasets on github, curated by caesar0301. AWS (Amazon Web Services) Public Data Sets, provides a centralized repository of public data sets that can be seamlessly integrated into AWS cloud-based applications. BigML big list of public data sources. Bioassay data, …

ادامه »

بهشت داده ها

سلام به همگی امیدوارم که تعطیلات عید رو بخوبی گذرونده باشید. امروز خیلی اتفاقی با یه مسئله ای برخورد کردم که حیفم اومد یه مطلب جداگانه برای معرفیش نذارم. اگه مطالب اولیه سایت رو خونده باشید و همینطور بخشهایی مثل منابع و ابزارها حتما اطلاع دارید که من دایما هر …

ادامه »

دیتا ست سرطان برای پروژه های داده کاوی

در این جا قصد دارم دو منبع دیتا ست سرطان را برای پروژه های داده کاوی برای شما معرفی کنم. دیتای سرطان منبع اول https://tcga-data.nci.nih.gov/docs/publications/tcga/ منبع دوم http://seer.cancer.gov/

ادامه »

مجموعه ۴۶ تایی از دیتاست های نامتوازن برای داده کاوی

امروز برای شما یه مجموعه ۴۶ تایی از داده های نامتوازن آماده کرده ایم این داده ها به شدت نامتوازن هستند و برای پروژه های داده کاوی که برای ارزیابی الگرویتم ها روی داده های نامتوازن هستند بسیار مناسب است .   Imbalanced data sets are a special case for …

ادامه »

دیتا ست تشخصی نفوذ در شبکه

این دیتاست برای کار پروژه های داده کاوی در تشخیص نفوذ در شبکه مورد استفاده قرار می گیرد. MACCDC – Pcaps from National CyberWatch Mid-Atlantic Collegiate Cyber Defense Competition http://www.netresec.com/?page=MACCDC ISTS – Pcaps from The Information Security Talent Search http://www.netresec.com/?page=ISTS Captures from the “2009 Inter-Service Academy Cyber Defense Competition” served …

ادامه »

وب سایت های مجموعه داده

وب سایت های مجموعه داده: http://aws.amazon.com/public-data-sets/ http://stackoverflow.com/questions/381806/large-public-datasets http://archive.ics.uci.edu/ml/datasets.html https://archive.org/details/stackexchange http://snap.stanford.edu/data/ https://networkdata.ics.uci.edu/resources.php https://www.kaggle.com/ Frontpage http://www.kdnuggets.com/datasets/index.html http://socialcomputing.asu.edu/pages/datasets http://nodexlgraphgallery.org/Pages/Default.aspx http://konect.uni-koblenz.de/networks/

ادامه »

دیتا ست های عالی برای کار داده کاوی

یک کاری که در فضاهای نه الزاما کاربردی -مثل سمینارهای قبل از پایان‌نامه- می‌توان انجام داد، بررسی نمونه داده‌هایی است که در سایتها به اشتراک گذاشته شده‌اند. فهرستی از صفحات پیشنهادی دانشجویان عزیز را-بدون اینکه قضاوتی درباره مفید بودن داده‌هایشان داشته باشیم- برای استفاده دیگر عزیزان تکمیل می‌نماییم: 🔴 بیش …

ادامه »