دانلود رایگان مقالات انگلیسی ISI با ترجمه فارسی

۴۱ مطلب با کلمه‌ی کلیدی «دانلود رایگان مقالات انگلیسی علوم داده» ثبت شده است

چالش های کلان داده (مقاله رایگان pdf)

چکیده 

        کلان داده  به داده‌هایی با حجم زیاد، از اگزابایت  (1018) و بیشتر از آن، گویند. این حجم از داده، از ظرفیت سیستم‌های پردازشی و سیستم‌های ذخیره آنلاین فعلی بیشتر است. داده ، اطلاعات  و دانش  در نرخی تولید و جمع آوری می‌شوند که خیلی سریع به حجم اگزابایت /سال می‌رسند. ایجاد و جمع آوری روز به روز سریعتر می‌شود و در طی چند سال به دامنه زتابایت /سال می‌رسند. حجم ، تنها یک جنبه کلان داده است، صفات دیگر، تنوع ، سرعت ، ارزش  و پیچیدگی  هستند. ذخیره و انتقال داده مسائل مربوط به تکنولوژی هستند، که به نظر می‌رسد که در آینده نزدیک به مشکلات آن‌ها رسیدگی می‌شود، اما چالش‌های بلند مدتی را نشان می‌دهند که نیازمند پارادایم‌های جدید و پژوهش است. ما مسائل و چالش‌ها را با شروع یک برنامه پژوهشی همکارانه بر متدلوژی‌هایی برای طراحی و تحلیل کلان داده آغاز کردیم. 

ادامه مطلب...
۰۷ آبان ۰۱ ، ۰۹:۰۹ ۰ نظر

سرقت ادبی خارجی (مقاله رایگان pdf)

چکیده 

        گروه بندی اسناد متنی یکی از عرصه‌های پژوهشی در حال ظهور است، که در آن اسناد شناخته شده هستند، به صورت دستی یا لگاریتمی دسته بندی شده و یا متمایز شده اند. مقاله بر استفاده از گروه بندی خودکار اسناد متنی در دامنه تشخیص سرقت ادبی تمرکز می‌کند. در جهان امروزی سرقت ادبی، به خصوص در زمینه آموزشی و پژوهشی یک نگرانی اصلی است. هدف این مقاله مطالعه و مقایسه روش‌های متفاوت گروه بندی اسناد در تشخیص سرقت ادبی خارجی است. در اینجا کانون اولیه کشف گروه بندی اسناد نظارت نشده / روش‌های خوشه بندی با استفاده از تغییرات متفاوت الگوریتم K-میانگین و مقایسه آن با روش مبتنی بر N-gram عمومی و روش مبتنی بر مدل فضای بردار است. سرانجام تحلیل و ارزیابی با استفاده از مجموعه داده ای از PAN-2013 ارزیابی شده است و عملکرد بر اساس precision، recall و efficiency از نظر زمان اجرای الگوریتم مقایسه می‌شود.

ادامه مطلب...
۰۴ آبان ۰۱ ، ۰۹:۵۹ ۰ نظر

محاسبات سبز (مقاله رایگان pdf)

چکیده

        ما به مسئله تخصیص منابع در محیط ابر در مقیاس بزرگ می پردازیم، که بهینه سازی پیکربندی ابر به‌صورت پویا برای اهداف محاسبات سبز تحت محدودیت های پردازنده و حافظه را رسمی می کنیم. ما پروتکل عمومی gossip را برای تخصیص منابع پیشنهاد می کنیم، که می تواند برای اهداف خاص معرفی شود. ما نمونه ای از این پروتکل عمومی را باهدف به حداقل رساندن مصرف انرژی از طریق تحکیم  سرور توسعه می دهیم، درحالی‌که رضایت مندی تغییر الگوی بارگیری برآورده شود. این پروتکل، GRMP-Q نامیده شد، که یک راه حل ابتکاری  کارآمد فراهم می کند که در اغلب موارد به خوبی عمل می کند— در موارد خاص، بهینه است. تحت سربار ، پروتکل یک تخصیص عادلانه از منابع پردازنده به خدمات گیرنده  را می دهد. نتایج شبیه سازی نشان می دهد که معیارهای کلیدی عملکرد، با افزایش اندازه سیستم تغییر نمی کند، فرآیند تخصیص منابع مقیاس پذیر برای بالاتر از 100000 سرور. به‌طورکلی، اثربخشی پروتکل در دستیابی به اهداف خود، با افزایش ظرفیت حافظه در سرورها، افزایش می یابد.

ادامه مطلب...
۲۴ مهر ۰۱ ، ۱۳:۳۸ ۰ نظر

محاسبات ژنومیک (مقاله رایگان pdf)

چکیده

       در سال های اخیر محاسبات علمی با استفاده گسترده از محاسبات ابری به دلیل انعطاف پذیری آن در مدیریت منابع محاسباتی تکامل یافته است. در این مقاله، ما روی پردازش داده های ژنومی که به سرعت در حال پیشرفت در تحقیق و فعالیت های پزشکی است، تمرکز می کنیم. از ویژگی های اصلی این مجموعه داده، نه تنها تعداد فایل های ژنوم موجود در حال تبدیل شدن بسیار بزرگ است، بلکه هر یک از مجموعه داده ها به تنهایی به طور قابل توجهی بزرگ بوده، و بیش از ده گیگابایت می باشد. از این رو، پردازش بخش بزرگی از داده های ژنومی مبتنی بر ابر، تاثیر قابل توجهی در منابع شبکه دارند، زیرا هر پردازش نیاز به انتقال دهها گیگابایت به گره های محاسبه دارد. برای بررسی این موضوع، در این مقاله ما یک چارچوب تعیین منابع پیشنهاد می کنیم که عوامل تصمیم گیری با اطلاعات مورد نیاز برای انتخاب مناسب ترین گره های محاسبه را فراهم می کند. ما تابع تعیین منابع را به صورت توزیع شده اجرا کرده، و به طور گسترده آن را در یک بستر آزمایشی آزمایشگاه متشکل از حدود 70 گره تست کردیم. ما دریافتیم اورهد راه حل پیشنهادی در مقایسه با مقدار داده منتقل شده، ناچیز است.

ادامه مطلب...
۲۴ مهر ۰۱ ، ۱۱:۴۶ ۰ نظر

شبکه های بدنه بی سیم (مقاله رایگان pdf)

چکیده

        شبکه‌های بدون سیم بدن منطقه (WBANS) به‌عنوان راه‌حلی موثر برای طیف گسترده مراقبت‌های بهداشتی و برنامه‌های کاربردی نظامی و ورزشی توسعه‌یافته است. بسیاری از فعالیت‌ها جمع‌آوری داده‌های کارآمد را از طریق بررسی مدل‌های قدیمی و فردی WBANS انجام داده اند. محاسبات ابری مدل محاسباتی جدیدی است که به‌طور مداوم در حال گسترش و تحول می‌باشد. این مقاله به بحث درباره سیستم جمع‌آوری کارآمد داده‌ها مبتنی بر تکه ابر (cloudlet) در WBANS می‌پردازد. هدف داشتن مقیاسی بزرگ از داده‌های مشاهده‌شده از WBANS می‌باشد تا برای کاربر نهایی و یا شرکت ارائه‌دهنده خدمات قابل‌دسترس باشد. یکی از نمونه‌های اولیه WBANS که شامل ماشین مجازی (VM) و تکه ابر مجازی شده (VC) می‌باشد، ارائه گردیده تا ویژگی‌های جمع‌آوری کارآمد داده‌ها را در WBANS شبیه‌سازی نماید. با استفاده از این مدل اولیه، ما می‌توانیم یک منبع ذخیره با قابلیت افزایش کارایی را ارائه داده و زیرساخت‌های سیستم‌های WBANS را در مقیاسی بزرگ‌تر نمایش دهیم. این زیرساخت‌ها می‌توانند به نحو مؤثری حجم زیادی از داده‌های تولیدشده را با استفاده از سیستم WBANS مدیریت نمایند. این کار با استفاده از ذخیره‌سازی داده‌ها و انجام تحلیل بر روی آن‌ها انجام می‌گیرد. مدل ارائه‌شده به طور کامل پویایی سیستم‌های WBANS را با استفاده از تکنولوژی‌های ارتباطی مقرون‌به‌صرفه WIFI و سلولی (سلولار) مورد پشتیبانی قرار می‌دهد که خود این تکنولوژی‌ها توسط سیستم‌های WBANS و VC مورد پشتیبانی قرار می‌گیرند. این موضوع با بسیاری از راهکارهای بهداشت موبایل (استفاده از موبایل و دیگر وسایل بی‌سیم در مراقبت پزشکی) که به دلیل تکنولوژی ارتباطی پرهزینه دارای محدودیت می‌باشند، در تضاد است، تکنولوژی‌هایی مانند 3G و LTE. عملکرد این مدل ارائه‌شده اولیه با استفاده از نسخه توسعه‌یافته شبیه‌ساز کلودسیم مورد ارزیابی قرار می‌گیرد. مشخص گردیده که میانگین مصرف برق و میزان تأخیر جمع‌آوری داده‌ها با افزایش تعداد VS ها و VC ها به طرز فوق‌العاده‌ای کاهش می‌یابد.

ادامه مطلب...
۲۳ مهر ۰۱ ، ۰۸:۱۸ ۰ نظر

تاثیر مقیاس بندی (مقاله رایگان pdf)

چکیده

          تحت محدودیت بودجه‌ی تبلیغاتی، بیشینه‌سازی انتخاب محصول در یک شبکه‌ی اجتماعی مشتری، یک مورد خاص و مهم از مساله‌ی عمومیِ بیشنه‌سازی تاثیر می‌باشد. تکنیک‌های بهینه‌سازیِ خاصی که همبستگی‌ها و تاثیرات جامعه‌‌ی محلی را در نظر می‌گیرند، می‌توانند عملکرد بهتری نسبت تکنیک‌های شبکه‌بنیان داشته باشند که باعث تعاملاتی می‌شوند که منبعث از بازاریابیِ محصولات متعدد برای یک گروه مشتری می‌باشد. با اینحال، این انجامپذیر است که از روشهای بهینه‌سازیِ دقیقی استفاده کنیم که از عملیات ماتریس پرهزینه‌ روی شبکه‌های بزرگ، بدون تکنیک‌های محاسباتیِ موازی استفاده ‌کند. در این فصل، یک رویکرد بیشینه‌سازی تاثیرِ سلسله‌مراتبی را برای بازاریابی محصول ارائه می‌دهیم که یک سلسله‌مراتب تجرید را برای مقیاس‌بندی تکنیک‌های بهینه‌سازی برای شبکه‌های بزرگ، می‌سازد. یک راه‌حل دقیق روی پارتیشن‌های کوچکترِ شبکه اِعمال می‎‌شود و مجموعه‌ای کاندید از گره‌های تاثیرگذار، به سمت بالا و به بازنمود مجردِ شبکه‌ی اریجنال منتشر می‌شود که اطلاعات مسافت را حفظ می‌کند. این فرایند تجرید، راه‌حل و انتشار، تا زمانی تکرار می‌شود که شبکه‌ی مجردِ حاصله، آنقدر کوچک شود که بتواند دقیقاً حل گردد.

ادامه مطلب...
۱۷ مهر ۰۱ ، ۱۲:۲۴ ۰ نظر

تخصیص و تقسیم داده ها (مقاله رایگان pdf)

چکیده

       طراحی یک سیستم پایگاه داده توزیع شده موثر (DDBS) به عنوان یکی از چالش برانگیز ترین مشکلات در نظر گرفته می شود به دلیل عوامل متعدد وابسته که بر روی عملکرد آن تاثیر گذار هستند . تخصیص و تکه تکه شدن دو فرآیند هستند که کارآیی و صحت آنها می تواند عملکرد DDBS را تحت تاثیر قرار دهد . بنابراین ، تکه تکه شدن کارآمد داده ها و تخصیص قطعات در سراسر قسمت های شبکه به عنوان یک حوزه مهم پژوهشی در طراحی پایگاه داده های توزیع شده به شمار می آید . در این مقاله ما یک روشی را ارائه می دهیم که در آن به طور همزمان به تکه تکه شدن داده ها و تخصیص قطعات مناسب در سراسر شبکه خواهیم پرداخت . الگوریتم انرژی پیوندی (BEA) با اندازه وابستگی بهتری برای بهبود خوشه های تولید شده از این ویژگی ها مورد استفاده قرار می گیرد . این الگوریتم به طور همزمان خوشه هایی از این ویژگی ها را تولید می کند، هزینه تخصیص هر خوشه به هر کدام از این محل ها را مورد محاسبه قرار می دهد و هر کدام از این خوشه ها را به مناسب ترین محل تخصیص می دهد.

ادامه مطلب...
۱۶ مهر ۰۱ ، ۰۸:۰۰ ۰ نظر

مسئله ی کوله پشتی (مقاله رایگان pdf)

چکیده

         این تحقیق شمال پیاده سازیِ برنامه نویسی شبکه ی ژنتیک (GNP) و برنامه نویسی پویای استاندارد به منظور حل مسئله ی کوله پشتی (KP) به عنوان سیستم پشتیبانی تصمیم برای خوشه بندی رکورد در پایگاه های داده ی توزیع شده می شود. تخصیص قطعه با مسئله ی محدودیت ظرفیت انباره، پیش زمینه ای برای روش پیشنهاد شده است. مسئله ی ظرفیت انباره برای توزیع مجموعه ها در چندین سایت (خوشه) است. مقدار کل قطعه ها در هر سایت نباید از ظرفیت سایت تجاوز کند، در حالیکه روند توزیع باید رابطه (تشابه) ی بین قطعه ها در هر سایت را حفظ کند. هدف، توزیع داده ی بزرگ بوسیله ی لحاظ کردن شباهتِ داده ی توزیع شده در هر سایت، در سایتهای مشخصی با مقدار محدود ظرفیت است. GNP برای حل این مسئله به کار گرفته می شود تا قواعد را بوسیله ی لحاظ کردن مشخصاتِ (محدوده ی مقدار) هر ویژگی در یک مجموعه ی داده، استخراج کند. روش پیشنهاد شده، روش استخراج قاعده ی انتخاب تصادفی جزیی در GNP را ارائه می کند تا الگوهای متداول در یک پایگاه داده را برای بهبود الگوریتم خوشه بندی (خصوصا برای مسائل داده ی بزرگ) شناسایی کند. مفهوم KP برای مسئله ی ظرفیت انباره به کار گرفته می شود و برنامه نویسی پویای استاندارد بوسیله ی لحاظ کردن شباهت (مقدار) و مقدار داده (وزن) ی متناسب با هر قاعده برای قواعد توزیع استفاده می شود تا ظرفیت های سایت را تطبیق دهد. از نتایج شبیه سازی مشخص می شود که روش پیشنهاد شده، برتری هایی نسبت به الگوریتم های خوشه بندی مرسوم نشان می دهد و از این رو روش پیشنهاد شده، روش خوشه بندی جدیدی با مسئله ی ظرفیت انباره ی اضافی فراهم می کند.

ادامه مطلب...
۱۴ مهر ۰۱ ، ۱۲:۳۴ ۰ نظر

بهداشت و درمان (مقاله رایگان pdf)

چکیده

         رایانش ابری یکی از تسهیل کننده های مهم انقلاب اطلاعات سلامت در کسب و کارهای بخش بهداشت و درمان است. تبادل جهانی سوابق در بخش سلامت از طریق رسانه های الکترونیکی توسط رایانش ابری تسهیل می شود. در بهداشت و درمان، این فناوری باعث افزایش ایمنی و ایجاد نوآوری می شود. ارتباط با ماتریس سلامت در سراسر جهان با استفاده از این فناوری امکان پذیر است. رایانش ابری استفاده شده است در بهداشت و درمان برای سال های متمادی است و در ارتباط با تحولات در تجارت تکامل یافته است. این تکنولوژی سخت افزار قابل دسترس استاندارد را برای برنامه های مختلف بهداشت و درمان از طریق اتصال شبکه ایجاد می کند. رایانش ابری و پردازش ارتباطات ایمن را تضمین می کند و سرورهای ابری همه داده های ضروری را ایمن می کنند. پزشکان می توانند به افراد در مورد سلامتی خود مشاوره دهند و رژیم های سلامت روزانه بیمار خود را تهیه کنند، و سلامت روانی و جسمانی آنها حفظ کنند. روانشناسان و روانپزشکان می توانند از ویدئو کنفرانسی که باعث راحتی بیماران می شود استفاده کنند. این مقاله رایانش ابری و نیاز آن در بهداشت و درمان را مورد بحث قرار می دهد. کلید اصلی مزایا، موانع و چالش‌های رایانش ابری برای صنعت بهداشت و درمان شناسایی شده‌اند. در نهایت، کاربردهای قابل توجه رایانش ابری برای بهداشت و درمان را مورد بحث قرار می دهد. امروزه بیشتر تامین کنندگان بهداشت و درمان ابزارهایی با قابلیت اینترنت اشیا (IoT) به بیماران ارائه می دهند و داده های بیمار فوراً به آنها مخابره می شود. پزشکان خود را با اتصال چنین دستگاه هایی به سیستم ابری بیمارستان ها. در نتیجه، رایانش ابری، در ارتباط با فناوری های در حال گسترش مانند تجزیه و تحلیل کلان داده ها، هوش مصنوعی و اینترنت اشیا پزشکی، کارایی را بهبود می بخشد و تعداد راه های ساده سازی ارائه بهداشت و درمان را گسترش می دهد و در دسترس بودن منابع، قابلیت همکاری را بهبود می بخشد و هزینه ها را کاهش می دهد.

ادامه مطلب...
۱۰ مهر ۰۱ ، ۱۴:۳۱ ۰ نظر

کدگذاری ویدئو (مقاله رایگان pdf)

چکیده

       در این مقاله، ما، استفاده از واحدهای پردازنده گرافیکی چند هسته ای (GPUs) برای کدگذاری و کدگشایی ویدئوها را بررسی می کنیم. پس از بررسی اجمالی کدگذاری های ویدئویی و GPUs، برخی از کارهای قبلی را در مورد ساختاردهی ماژول های کدگذاری ویدئو مرور می کنیم به طوری که قابلیت پردازش موازی گسترده GPUs را می توان مهار نمود. همچنین کارهای قبلی انجام شده در مورد پارتیشن بندی جریان کدگشایی ویدئو بین واحد مرکزی پردازش (CPU) و (GPU) را مرور می کنیم. سپس، به صورت مفصل، برآورد حرکت سریع مبتنی بر GPU را برای نشان دادن برخی از ملاحظات طراحی در استفاده از GPUها در کدگذاری ویدئو و تعادل بین عملکرد افزایش سرعت و انحراف نرخ مورد بحث قرار می دهیم. نتایج ما، اهمیت مواجهه موازی سازی داده های ممکن را در طراحی الگوریتم ها برای GPUs برجسته می کند. 

ادامه مطلب...
۰۴ مهر ۰۱ ، ۰۹:۰۹ ۰ نظر