نحوه استفاده از text analyzer
این یک پروژه نمونه به زبان پایتون است، نشان دادن برنامه ای که یک فایل نمونه را تجزیه و تحلیل (text analyzer) می کند تا میزان درصد کارکتر ها در متن چه مقداری را اشغال می کند. این بخش نشان می دهد که چگونه فایل را می توان باز کرد و خواند.
filename = input("Enter a filename: ")
with open(filename) as f:
text = f.read()
print(text)
این قسمت از برنامه یک تابع را نشان می دهد که چند بار شمارش یک کارکتر در یک رشته رخ می دهد.
def count_char(text, char):
count = 0
for c in text:
if c == char:
count += 1
return count
این تابع به عنوان آرگومان فایل مورد نظر و یک کارکتر را دریافت می کند، و تعداد بار هایی که آن کارکتر در متن مشاهده شده است را باز می گرداند. اکنون می توانیم آن را برای پرونده ما صدا بزنیم.
filename = input("Enter a filename: ")
with open(filename) as f:
text = f.read()
print(count_char(text, "r"))
خروجی:
>>>
Enter a filename: test.txt
83
>>>
نکته: به عنوان مثال در یک متن فرضی حرف r 83 بار مشاهده شده است. بخش بعدی برنامه متوجه می شود که هر متن از چه مقدار از حروف الفبا اشغال شده است.
for char in "abcdefghijklmnopqrstuvwxyz":
perc = 100 * count_char(text, char) / len(text)
print("{0} - {1}%".format(char, round(perc, 2)))
خوب حالا وقت گذاشتن همه این توابع در یک کد کلیست.
def count_char(text, char):
count = 0
for c in text:
if c == char:
count += 1
return count
filename = input("Enter a filename: ")
with open(filename) as f:
text = f.read()
for char in "abcdefghijklmnopqrstuvwxyz":
perc = 100 * count_char(text, char) / len(text)
print("{0} - {1}%".format(char, round(perc, 2)))
خروجی:
Enter a filename: test.txt
a - 4.68%
b - 4.94%
c - 2.28%
...