عنوان مقاله:

یک روش داده کاوی متن گسسته محلی در فضای داده با ابعاد بالا

A Local Discrete Text Data Mining Method in High-Dimensional Data Space

سال انتشار: 2022

رشته: مهندسی صنایع - مهندسی فناوری اطلاعات - مهندسی کامپیوتر

گرایش: داده کاوی - اینترنت و شبکه های گسترده - مهندسی الگوریتم و محاسبات - هوش مصنوعی

دانلود رایگان این مقاله :

دانلود مقاله داده کاوی متن گسسته

مشاهده سایر مقالات جدید:

 

مقالات ISI مهندسی صنایع

 

مقالات ISI مهندسی فناوری اطلاعات

Discussion and Analysis
The data set was from the access records saved in the Web log of a website of a software certification training center on a certain day. The users of the website use the local discrete text data mining method in the high-dimensional data space proposed in this chapter to perform secondary processing on the search engine when conducting Web information retrieval, accessing approximate Web page clusters. The purpose of the research is to recognize the browsing path of users through Web click flow, so as to predict the sequence of users browsing Web pages, and to sort the word segmentation dictionary of related topics accordingly, so as to obtain the order of similar Web page clusters in the next search. This can make it conform to the interests of users. Data mining is a method of effectively classifying the features of data and excavating its internal correlation. It has been widely used in many scientific fields. The data mining algorithm is simple, fast, scalable, and maintainable. Users can change the keyword database they are interested in according to their own needs, which is convenient for users to find the information they really care about and has high application value.

(دقت کنید که این بخش از متن، با استفاده از گوگل ترنسلیت ترجمه شده و توسط مترجمین سایت ای ترجمه، ترجمه نشده است و صرفا جهت آشنایی شما با متن میباشد.)

بحث و تحلیل
مجموعه داده ها از سوابق دسترسی ذخیره شده در گزارش وب سایت یک مرکز آموزشی صدور گواهینامه نرم افزار در یک روز معین بود. کاربران وب سایت از روش داده کاوی متن گسسته محلی در فضای داده با ابعاد بالا پیشنهاد شده در این فصل برای انجام پردازش ثانویه در موتور جستجو هنگام انجام بازیابی اطلاعات وب، دسترسی به خوشه های تقریبی صفحات وب استفاده می کنند. هدف از این تحقیق شناسایی مسیر مرور کاربران از طریق جریان کلیک وب، به منظور پیش‌بینی توالی کاربران در حال مرور صفحات وب، و مرتب‌سازی فرهنگ لغت تقسیم‌بندی کلمات موضوعات مرتبط بر اساس آن، به منظور به دست آوردن ترتیب مشابه است. خوشه های صفحه وب در جستجوی بعدی. این می تواند آن را با علایق کاربران مطابقت دهد. داده کاوی روشی برای طبقه بندی موثر ویژگی های داده ها و کشف همبستگی داخلی آن است. در بسیاری از زمینه های علمی مورد استفاده قرار گرفته است. الگوریتم داده کاوی ساده، سریع، مقیاس پذیر و قابل نگهداری است. کاربران می توانند پایگاه داده کلمات کلیدی مورد نظر خود را با توجه به نیازهای خود تغییر دهند، که برای کاربران راحت است تا اطلاعاتی را که واقعاً به آنها اهمیت می دهند پیدا کنند و ارزش کاربردی بالایی دارد.