کامیار جوانمردی؛ منوچهر اکبری
دوره 4، شماره 3 ، آذر 1397، ، صفحه 121-144
چکیده
شناسایی سبک نویسنده و پردازش زبان طبیعی از اهمیت ویژهای برخوردار است و پژوهش در این زمینه به دو صورت کیفی و کمی انجام میشود. ازآنجاییکه شعر و ادبیات همواره یکی از افتخارات تاریخی زبان فارسی بهشمار ...
بیشتر
شناسایی سبک نویسنده و پردازش زبان طبیعی از اهمیت ویژهای برخوردار است و پژوهش در این زمینه به دو صورت کیفی و کمی انجام میشود. ازآنجاییکه شعر و ادبیات همواره یکی از افتخارات تاریخی زبان فارسی بهشمار میآید، شناسایی سبک نویسندگان و شاعران بهصورت گسترده، بدوناعمال نظرات انسانی و به شیوۀ کمی، امری ضروری است. در این پژوهش کاربرد روشهای آماری برای شناسایی سبک نویسنده مورد بررسی قرار میگیرد؛ بههمیندلیل، ویژگیهای واژگانی، حرفی و نحوی از متنهای منتخب استخراج میشود. هدف اصلی مقاله، استخراج ویژگیهای صوری متن و دستهبندی اشعار مربوط به دو شاعر حوزۀ دفاع مقدس (قیصر امینپور و محمدرضا عبدالملکیان) است. بهاینمنظور، از دو دستهبند K نزدیکترین همسایه و بیز ساده جهت انجام عمل دستهبندی و انتساب دادهها استفاده شد. بررسی هر کدام از دستهبندها با استفاده از معیارهای ارزیابی، انجام شد. نتایج ارزیابیها روی سه نوع ویژگی نشان داد، ویژگیهای واژگانی بدون حذف واژههای دستوری در دستهبند بیز ساده با 92 درصد معیار F از بالاترین دقت در میان انواع ویژگیها برخوردار است. این نتیجه، نشاندهنده کارآیی قابلملاحظۀ این نوع ویژگی در شناسایی سبک نویسنده است.