معرفی شرکت
شرکت پردازشگران زبانِ ویرا (سهامی خاص) شرکتی فعال درزمینۀ هوش مصنوعی و پردازش زبان طبیعی است. یکی از محصولات این شرکت که از سال 1396 تاکنون به تولید آن پرداخته شده، سامانۀ هوشمند ویراستاری آنلاین متن فارسی با نام «ویراویراست» است. این سامانه با استفاده از الگوریتمهای پیشرفته و بهروز هوش مصنوعی و دانش زبانشناسی بهدست فارغالتحصیلان این حوزهها از دانشگاه شیراز تولید شده است.
محصولات شرکت پردازشگران زبانِ ویرا
ویراویراست: این سامانه دارای بخشهای (تایپ گفتاری، غلطیابی املایی، دستور خط، علائم نگارشی و ویراستاری پیشرفته) است. بخشهایی از ویراویراست مانند غلطیابی در سطح جمله و بررسی باهمآیی واژهها برای اولینبار روی زبان فارسی انجام شده است و قابلیت یادگیری خودکار از رفتار کاربر را نیز دارد. ویراویراست قابلیت دسترسی بر سیستمهای عامل اندروید، ios و افزونۀ مایکروسافت را دارد. بخش تولید، بررسی و ویرایش دادههای متنی که شامل میلیونها واژه و عبارت است برعهدۀ کسانی است که درزمینۀ ساختواژه، ویراستاری و معنیشناسی تخصص دارند. بخش پردازش زبان و برنامهنویسی نیز توسط متخصصان حرفهای هوش مصنوعیِ شرکت انجام شده است. ویراویراست در تاریخ 23/2/1399 بهدست جناب آقای دکتر ستاری «معاونت محترم علمی و فناوری رئیسجمهور و رئیس بنیاد ملی نخبگان کشور» رونمایی شد.بخشهای ویراویراست
تایپ گفتاری: این برنامه با استفاده از فنّاوری گفتار به نوشتار، گفتار فارسی را به متن تبدیل میکند. فقط کافی است در بخش تایپ گفتاری روی علامت میکروفون کلیک کنید و متن یا ایدۀ خود را بخوانید تا متن شما با سرعت و دقت بالا و تا سقف 5 هزار کلمه تایپ شود. باید بگوییم که این بخش بهصورت کاملاً رایگان در اختیار شما پس از ثبتنام در سایت قرار میگیرد.غلطیابی املایی: غلطیابی املایی با استفاده از الگوریتمهای یادگیری ماشین و شبکۀ عصبی طراحی شده است. این بخش در کمتر از چند ثانیه، واژههایی را که املای نادرستی دارند، تشخیص میدهد؛ سپس واژه یا فهرستی مناسب و درست از نزدیکترین واژهها به واژۀ موردنظر را به کاربر پیشنهاد میدهد.
دستور خط: فرهنگستان زبان و ادب فارسی مصوباتی را درمورد فاصلهگذاریهای «واژههای مرکب»، «پسوندها و پیشوندها»، «حروف ندا»، «نشانهگذاری (اِعراب)» و «تنوینگذاری» را تصویب کرده است. در این بخش این مصوبات یا بهصورت خودکار روی متن اعمال و یا بهصورت پیشنهادِ درست به کاربر اعلام میشوند. باید بگوییم که ویراویراست نخستین سامانهای است که فاصلهگذاری درست را بر اساس بافت متنی اعمال میکند. همچنین نویسههای عربی مانند «ک و ی» را با نویسههای درست خط فارسی جایگزین میکند. در این بخش اعداد انگلیسی در متن فارسی نیز، به اعداد فارسی تبدیل میشوند.
ویراستاری پیشرفته: یک نوع دیدگاه برای زبان معیار فارسی وجود دارد. زبان معیار زبانی است که زبانشناسان و ادیبان نمیتوانند به آن خرده بگیرند و درعینحال افراد متوسط جامعه ازنظر سواد و معلومات، آن را بهراحتی میفهمند. این سوال پیش میآید که در زبان معیار چه ویژگیهایی وجود دارد، چه عناصری راه دارد و چه عناصری راه ندارد. سعی شده است که در این بخش قسمت عمدۀ آن ویژگیها به کاربر اطلاع داده شود. مهمترین عناصری که نباید در زبان معیار وجود داشته باشد عبارتاند از: استفاده از ترکیبهای نادرستی همچون حشو (حُسن خوب) و گرتهبرداری (روی کسی حساب کردن)، استفاده از مصدرهای جعلی و نادرست (خوبیت)، استفاده از نشانههای جمع نادرست (مدارکها) و همچنین ترکیبها و ساختهایی که ادیبان بهکاربردن آنها را درست نمیدانند؛ همچون «را»ی مفعولی که برخی از نویسندگان بعد از فعل میآورند که این کاربرد نادرست است. در ویراستاری پیشرفته همچنین پیشنهاد گذاشتن «ۀ» به کلماتی که به «ها»ی غیرملفوظ ختم میشوند و نقش مضاف دارند داده میشود. مانند: برای «خانه خدا»، «خانۀ خدا» را پیشنهاد میدهد.
علائم نگارشی: در این بخش جایگذاری درست نشانههای نگارشی اعمال میشود. مانند اینکه پایان جمله نقطه گذاشته شود، قبل از کلمات توضیحی نقطهویرگول قرار بگیرد، بین نقطه، ویرگول و علائم نگارشی با کلمۀ قبل، فاصله وجود نداشته باشد و غیر آن.