نوشته شده توسط ام نوت

استخراج مدل برداری کلمات فارسی ویکی‌پدیا (Word2vec Wikipedia)

فایل مدل مدل برداری کلمات فارسی بر اساس ویکیپدیا فارسی (تا تاریخ ۲۰ اکتبر ۲۰۱۶) از لینک زیر قابل دریافت می باشد. دریافت فایل مدل نحوه استفاده ابتدا پکیج genism را نصب کرده، سپس با استفاده از قطعه کد زیر مدل را بارگذاری کرده و با متد most_similar کلمات با بیشترین شباهت با کلمه/کلمات ورودی […]

پردازش متون فارسی با پایتون

پردازش متن به عنوان یکی از زیرحوزه های فعال هوش مصنوعی، سابقه ای دیرینه در زبان فارسی دارد و آزمایشگاه های مختلفی در دانشگاه ها و سازمانها برای پردازش متن شکل گرفته اند که آزمایشگاه پردازش متن و زبان طبیعی دانشگاه تهران و آزمایشگاه فناوری وب دانشگاه فردوسی و کارگروه خط و زبان فارسی در […]