Python İle Dosya Karakter Setini Öğrenme

Gedit için bir proje yöneticisi geliştiriyorum. Dosyaların açılması sırasında utf-8 harici karakter setli dosyalarda hata çıkıyordu. Gedit içerisinde(python eklentisi oluşturma için sunulan özelliklerde) sanırım otomatik olarak karakter setini tanıma gibi bir özellik yok. Araştırmalarım neticesinde chardet ile karşılaştım. Bir dosya ile kullanımına dair örneğe şu adresten erişebilirsiniz.

Şöyle bir yöntemde işe yarayabiliyor bazen.

 
import os
dosya = "/home/omer/test.py"
print os.popen("file %s" %(dosya)).read().replace("\n","").split(" ")[1].lower()
 

Düzeltme:
Gedit için python eklentisi yazarsanız aşağıdaki şekilde dosya açmanız işleri epey kolaylaştırıyor. Yukarıdaki modüle gerek kalmadan hallettim. Karakter farklılığını göz ardı ediyor, kendisi otomatik olarak tanıyıp dosyayı açıyor.

 
gedit.commands.load_uri(self._window,"file://%s" %(dosya))
 

Tags: ,

Leave a Reply