ما در عصر اطلاعات زندگی می کنیم و همواره در حال درک و دریافت دادههای زیادی از دنیای اطراف خود هستیم که برای استفاده از این اطلاعات لازم است آنها را به کمک آمار و بهصورت ریاضی بیان کنیم. آمار در همهی زمینهها نقش موثری ایفا میکند. یکی از مواردی که جدیدا مورد توجه قرار گرفته و از فنون آماری کمک میگیرد، متن کاوی است. متن کاوی یک روش تحقیقی برای شناسایی الگوهای موجود در متون است که میتواند نوشتاری، گفتاری و یا تصویری باشد. متن کاوی بسیار گسترده است همانند طبقه بندی متون، خوشهبندی متون، وبکاوی و عقیده کاوی و .... تکنیکهای متن کاوی بهکار گرفته میشود تا مقادیر عددی را برای یک متن تعیین کند. از آنجا که اساس کار با داده، دارا بودن علم آمار است. پس با استفاده از ابزارهای آماری به تحلیل متن می پردازند همانند پیش بینی افزایش یا کاهش قیمت دلار یا سهام با استفاده از اطلاعات متنی امروز. بهکارگیری روشهای آماری می تواند حقایق موجود در متن را کشف، تائید و یا رد کند. امروزه این مبحث در یادگیری ماشین بسیار پر کاربرد است. در این مقاله سعی کردیم تا آشنایی ابتدایی با ابزارهای آماری در روش متن کاوی داشته باشیم و از این ابزار قدرتمند برای تحلیل وقایع استفاده کنیم.