پروپوزال بهبود ابهام زدایی کلمات با استفاده از روش خوشه بندی گراف مبتنی بر کشف انجمنی
دانلود فایل های همراه محصول
شرح مختصر محصول
این پروپوزال با موضوع "بهبود ابهام زدایی کلمات با استفاده از روش خوشه بندی گراف مبتنی بر کشف انجمنی" می باشد. فایل Word, Pdf پس از خرید محصول، قابل دانلود است. همچنین تعداد صفحات این پروپوزال 7 صفحه با رعایت قالب استاندارد دانشگاه می باشد. کلیه نکات نگارشی مطابق با استاندارهای پژوهشی انجام شده است.
امکانات اصلی این پروپوزال پس از خرید عبارتند از:
امکان دانلود فایل Word پروپوزال
امکان دانلود فایل Pdf پروپوزال
توجه : در صورت نیاز به پایان نامه، پروپوزال یا شبیه سازی مشابه با این محصول و همچنین اصلاحات پس از خرید کافی است با تیم پشتیبانی "ناب تزیز" از طریق پیامک یا واتساپ ارتباط برقرار نمایید.
شرح کلی محصول
ابهام زدایی کلمات مبهم یکی از زیر شاخه های حوزه پردازش زبان طبیعی می باشد که در اواخر دهه 1940 به عنوان یکی از کارهای اساسی در زمینه ترجمه ماشینی مطرح شد و در دهه 1980 با انتشار منابع لغوی بزرگ که خود، روش های خودکار برای جمع آوری منابع لغوی جهت انتشار دانش را موجب می شد، به نقطه عطفی دست یافت.
ابهام زدایی کلمات مبهم به معنای شناسایی و تعیین معنای اصلی کلمات موجود در یک قطعه متن می باشد که این قطعه متن می تواند کل جمله و یا بخشی از جمله باشد.یکی از مهم ترین کاربردهای ابهام زدایی در ترجمه ماشینی است، که با اضافه شدن آن به عنوان یک مرحله میانی می تواند تاثیر قابل قبولی در کیفیت ترجمه ماشینی داشته باشد.
ابهام زدایی کلمات مبهم در بین مسائلی که در زمینه متن کاوی هستند مشکلات و سختی های خاص خود را دارد و یکی از دلایل اصلی سختی این موضوع مبهم بودن زبان طبیعی انسان و طبیعت بدون ساختار آن می باشد، چون هر کلمه با توجه به جمله ای که در آن قرار می گیرد می تواند معنای متفاوتی داشته باشد و جملات که از مجموعه ای از کلمات تشکیل شده اند، معمولاً به تنهایی مبهم بوده و با قرار گرفتن در کنار کلمات دیگر در یک جمله از ابهام آن ها کاسته می شود و همچنین می توان به مشکل وابستگی روش های ابهام زدایی به منابع اطلاعاتی اشاره نمود، به این دلیل که منابع اطلاعاتی موجود معمولاً کامل نیستند.
مفهوم یک کلمه می تواند همان معنی کلمه باشد. مفاهیم متفاوت یک کلمه هر چند هم به یک کلمه مشابه اشاره داشته باشند، ممکن است مربوط به استفاده های متفاوت از آن کلمه باشد.
انگیزه اصلی برای ابهام زدایی کلمات مبهم این بوده که به کاربران اجازه دهد تا از تکنولوژی های موجود استفاده نمایند چون ابهام در هر زبانی مشکلات زیادی را در استفاده از تکنولوژی اطلاعات به دلیل اینکه بعضی کلمات در زبان انسان می توانند دارای چندین معنی متفاوت باشند، به وجود می آورد.
با یک مثال می توان این مسله را روشن تر بیان کرد. دو جمله زیر را در نظر بگیرید:
(a) I can hear bass sounds.
(b) They like grilled bass.
به طور واضحی مشخص است که کلمه bass در این جمله ها معانی متفاوتی دارند. در جمله a به معنای "صدای با فرکانس کم" و در جمله b به معنای "نوعی ماهی" می باشد.
اگر نقطه ها را در متن نادیده بگیریم، متن T را به عنوان ترتیبی از کلمات w1,w2,w3,… داریم و می بایست مفهوم یا مفاهیم مناسب را به همه یا بعضی از کلمات T اختصاص دهیم; یا به عبارت دیگر mapping A از کلمات به مفاهیم به طوری که A(i)⊆SENSED(Wi)، که SENSED(Wi) یعنی مجموعه مفاهیم پیدا شده از دیکشنری D برای کلمه W(i)، و A(i) به معنای زیرمجموعه ای از مفاهیم Wiمی باشد که برای عبارت T مناسب اند.
در واقع می شود به دو روش روی مشکل ابهام در معنای کلمات کار کرد:
1. استفاده از نمونه های لغوی : سیستمی که یک مجموعه متناهی از کلمات موردنظر را که معمولاً فقط یک بار در هر جمله می آیند را ابهام زدایی می کند که معمولاًروش های مبتنی بر ناظر در این سیستم ها به کار گرفته می شود.
2. ابهام زدایی تمام کلمات متن : در این روش تمام کلمات موجود در یک متن اعم از اسم، فعل، صفت و قید ابهام زدایی می-شوند. این کار به منابع اطلاعاتی با پوشش گسترده نیاز دارد.
چهار جزء اصلی ابهام زدایی شامل موارد زیر می باشد:
a. انتخاب مفهوم کلمات (همان کلاس ها در روش های آموزشی)
b. استفاده از یک منبع اطلاعاتی خارجی
c. نمایش متن
d. انتخاب یک روش دسته بندی اتوماتیک
روش های ابهام زدایی کلمات مبهم به طور کلی شامل سه دسته می باشد:
- روش های مبتنی بر دانش : این روش ها معمولاً از یک منبع دانش یا از قوانین گرامری برای ابهام زدایی متن استفاده می کنند.
- روش های یادگیری ماشینی : معمولاً از یک مجموعه شامل نوشتجات برچسب گذاری شده یا بدون برچسب برای ایجاد مدل احتمالی یا آماری استفاده می کنند.
- روش های پیوندی: از مجموعه شامل نوشتجات و روابط معنایی میان کلمات در WordNet برای ابهام زدایی استفاده می کنند.
ساده ترین و اولین روشی که برای ابهام زدایی مطرح شد، روشی احتمالی بود که برای تمام معانی کلمه درصد احتمال را محاسبه می کرد و معنی با بیشترین احتمال را به عنوان معنی برنده معرفی می کرد.
مشکلی که بر سر راه ابهام زدایی کلمات مبهم وجود دارد می تواند به دو بخش تقسیم شود: جناس و ترادف.جناس یعنی یک کلمه دارای دو یا چند معنی متفاوت باشد و ترادف به این معناست که چندین کلمه مختلف دارای یک معنای مشابه باشند.
منابع دانش زیادی برای کمک به کار ابهام زدایی کلمات مبهم وجود دارد که از جمله این منابع WordNet و Wikipedia و BabelNet می باشد.
WordNet یک منبع لغات برای زبان انگلیسی می باشد که لغات مترادف را در یک مجموعه مترادف دسته بندی کرده است و در آن یک رابطه معنایی بین کلمات وجود دارد. WordNet همچنین شامل تعاریف کوتاه، مثال و عددی که نشان دهنده میزان رابطه میان اعضای مجموعه مترادف است، نیز می باشد. پس می توان آن را به عنوان ترکیبی از دیکشنری و فرهنگ لغت در نظر گرفت.
BabelNet یک شبکه معنایی چندزبانه است که به صورت خودکار از طریق اتصال بزرگترین دانشنامه چندزبانه وب (Wikipedia) به محبوب ترین واژه نامه محاسباتی زبان انگلیسی (WordNet) ایجاد شده است.
موضوع دیگری که در این راستا بررسی خواهد شد، پیوند نهادها(Entity Linking) می باشد. پیوند نهادها روی پیدا کردن اشاره ها به اسامی در متن و پیوند آن ها به مناسب ترین داده در منبع دانش تمرکز دارد.
ابهام زدایی کلمات مبهم و پیوند نهادها هر چند دو موضوع متفاوت هستند ولی در واقع بسیار به هم شبیه و نزدیک هستند.
محصولات مشابه
نظرات (0)