توضیحاتی در مورد کتاب A conceptual density-based approach for the disambiguation of toponyms
نام کتاب : A conceptual density-based approach for the disambiguation of toponyms
عنوان ترجمه شده به فارسی : یک رویکرد مبتنی بر چگالی مفهومی برای ابهامزدایی از نامها
سری :
نویسندگان : Buscaldi Davide, Rosso Paulo.
ناشر :
سال نشر :
تعداد صفحات : 14
زبان کتاب : English
فرمت کتاب : pdf
حجم کتاب : 337 کیلوبایت
بعد از تکمیل فرایند پرداخت لینک دانلود کتاب ارائه خواهد شد. درصورت ثبت نام و ورود به حساب کاربری خود قادر خواهید بود لیست کتاب های خریداری شده را مشاهده فرمایید.
توضیحاتی در مورد کتاب :
مجله بین المللی علوم اطلاعات جغرافیایی.جلد. 22, №3 — والنسیا: Universidad Polite´cnica de Valencia, 2008. — ص. 301-313.
امروزه، حجم عظیمی از اطلاعات در قالب دیجیتال ذخیره می شود. بخش بزرگی از این اطلاعات را اسناد متنی و بدون ساختار تشکیل میدهند، جایی که ارجاعات جغرافیایی معمولاً با استفاده از نام مکانها ارائه میشوند. یک مشکل رایج در بازیابی اطلاعات متنی با کلمات چند معنایی نشان داده می شود، یعنی کلمات می توانند بیش از یک معنا داشته باشند. این مشکل در حوزه جغرافیایی نیز وجود دارد: نام مکان ها ممکن است به مکان های مختلفی در جهان اشاره داشته باشند. در این مقاله به بررسی استفاده از تکنیک ابهامزدایی معنی کلمه خود در حوزه جغرافیایی، با هدف حل نام مکانهای مبهم میپردازیم. تکنیک ما بر اساس چگالی مفهومی WordNet است.
به دلیل عدم وجود یک پیکره مرجع برچسبگذاری شده با حواس WordNet، آزمایشها را روی مجموعهای از 1210 نام مکان استخراجشده از مجموعه SemCor که GeoSemCor نامگذاری کردیم و به صورت عمومی منتشر کردیم، انجام دادیم. در دسترس. ما روش خود را با متداول ترین خط پایه و روش Lesk افزایش یافته مقایسه کردیم، که قبلاً در زمینه های بزرگ آزمایش نشده است. نتایج نشان میدهد که با استفاده از یک زمینه کوچک (سطح عبارت) میتوان به دقت بهتری دست یافت، در حالی که با استفاده از زمینههای بزرگ (سطح سند) پوشش بیشتری را میتوان به دست آورد. روش پیشنهادی باید با سایر گروهها آزمایش شود، زیرا آزمایشهای ما سوگیری بیش از حد نسبت به متداولترین حس GeoSemCor را نشان میدهد.
توضیحاتی در مورد کتاب به زبان اصلی :
International Journal of Geographical Information Science.Vol. 22, №3 — Valencia: Universidad Polite´cnica de Valencia, 2008. — p. 301-313.
Nowadays, a huge quantity of information is stored in digital format. A great portion of this information is constituted by textual and unstructured documents, where geographical references are usually given by means of place names. A common problem with textual information retrieval is represented by polysemous words, that is, words can have more than one sense. This problem is present also in the geographical domain: place names may refer to different locations in the world. In this paper we investigate the use of our word sense disambiguation technique in the geographical domain, with the aim of resolving ambiguous place names. Our technique is based on WordNet conceptual density.
Due to the lack of a reference corpus tagged with WordNet senses, we carried out the experiments over a set of 1,210 place names extracted from the SemCor corpus that we named GeoSemCor and made publicly available. We compared our method with the most-frequent baseline and the enhanced-Lesk method, which previously has not been tested in large contexts. The results show that a better precision can be achieved by using a small context (phrase level), whereas a greater coverage can be obtained by using large contexts (document level). The proposed method should be tested with other corpora, due to the fact that our experiments evidenced the excessive bias towards the most-frequent sense of the GeoSemCor.