Creative Commons License
Zargan Ltd.'ye ait bir eser olan Zargan Türkçe Kelime Veritabanı
"Creative Commons Alıntı-Gayriticari-LisansDevam 4.0" lisansına tabidir.

Atıfta bulunmak için:
Bilgin, O. (2016). Biçimbilimsel Bakımdan Karmaşık Türkçe Kelimelerin İşlenmesinde Frekans Etkileri (yayınlanmamış yüksek lisans tezi). Boğaziçi Üniversitesi, İstanbul. Erişim: http://st2.zargan.com/public/resources/turkish/frequency_effects_in_turkish.pdf

İletişim: info@zargan.com




Paketin içindekiler

Dosya Açıklama
word_forms_stems_and_frequencies_full.zip 1,337,898 kelime ve bunların kökleri, morfolojik analizleri ve sıklıkları (Kaynak: BÜ Derlemi)
word_families.zip 3,209 kelime ailesine ayrılmış 8,766 kelime gövdesi
noun_properties.zip 25,723 isim gövdesi ve bunların 9 özelliği (yalın haldeki, çekim eki almış haldeki, yapım eki almış haldeki ve -(s)I eki almış haldeki sıklık değerleri, karakter sayısı, hece sayısı, ortalama ikili harf dizisi sıklığı, 'komşu' kelime sayısı, kelime türü (a- basit, b- karmaşık ve kurallı, c- karmaşık ve kalıplaşmış)
suffix_sequence_properties.zip 24,394 ek dizisi ve bunların 18 özelliği (toplam sıklık, ek ağacındaki 'ebeveyn' sayısı, ebeveynlerin sıklığı, ek ağacındaki 'çocuk' sayısı, çocukların sıklığı, ek ağacındaki 'kardeş' sayısı, kardeşlerin sıklığı, ek sayısı, ortalama ek sıklığı, ikili ek dizisi (bigram) sayısı, ortalama ikili ek dizisi sıklığı, üçlü ek dizisi (trigram) sayısı, ortalama üçlü ek dizisi sıklığı, çekim eki sayısı, yapım eki sayısı, -(s)I eki sayısı, bloklanma pozisyonu, ek dizisinin karakter sayısı)
suffix_tree.zip BÜ Derleminde varolan tüm ek dizilerinin tek bir ağaç üzerinde gösterimi (GML: Graph Modelling Language) (Kaynak: BÜ Derlemi)
stems_and_frequencies_200d.zip 30,862 kelime gövdesi ve bunların 200-boyuttaki sıklıkları (boyutların sıralı listesi: top_200_suffix_sequences_attached_to_nouns.zip)
top_200_suffix_sequences_attached_to_nouns.zip İsim köklerine eklenen en yaygın 200 ek dizisi (Kaynak: BÜ Derlemi)
letter_unigram_frequencies_anywhere.zip 31 harfin kelimenin herhangi bir yerindeki sıklığı (Kaynak: BÜ Derlemi)
letter_unigram_frequencies_word-final.zip 31 harfin kelime sonlarındaki sıklığı (Kaynak: BÜ Derlemi)
letter_unigram_frequencies_word-initial.zip 28 harfin kelime başlarındaki sıklığı (Kaynak: BÜ Derlemi)
letter_bigram_frequencies_anywhere.zip 790 ikili harf dizisinin kelimenin herhangi bir yerindeki sıklığı (Kaynak: BÜ Derlemi)
letter_bigram_frequencies_word-final.zip 560 ikili harf dizisinin kelime sonlarındaki sıklığı (Kaynak: BÜ Derlemi)
letter_bigram_frequencies_word-initial.zip 514 ikili harf dizisinin kelime başlarındaki sıklığı (Kaynak: BÜ Derlemi)
letter_trigram_frequencies_anywhere.zip 9,241 üçlü harf dizisinin kelimenin herhangi bir yerindeki sıklığı (Kaynak: BÜ Derlemi)
letter_trigram_frequencies_word-final.zip 4,276 üçlü harf dizisinin kelime sonlarındaki sıklığı (Kaynak: BÜ Derlemi)
letter_trigram_frequencies_word-initial.zip 4,041 üçlü harf dizisinin kelime başlarındaki sıklığı (Kaynak: BÜ Derlemi)
suffix_unigram_frequencies_anywhere.zip 72 ekin ek dizisinin herhangi bir yerindeki sıklığı (Kaynak: BÜ Derlemi)
suffix_unigram_frequencies_template-final.zip 55 ekin ek dizisi sonlarındaki sıklığı (Kaynak: BÜ Derlemi)
suffix_unigram_frequencies_template-initial.zip 69 ekin ek dizisi başlarındaki sıklığı (Kaynak: BÜ Derlemi)
suffix_bigram_frequencies_anywhere.zip 942 ikili ek dizisinin ek dizisinin herhangi bir yerindeki sıklığı (Kaynak: BÜ Derlemi)
suffix_bigram_frequencies_template-final.zip 801 ikili ek dizisinin ek dizisi sonlarındaki sıklığı (Kaynak: BÜ Derlemi)
suffix_bigram_frequencies_template-initial.zip 921 ikili ek dizisinin ek dizisi başlarındaki sıklığı (Kaynak: BÜ Derlemi)
suffix_trigram_frequencies_anywhere.zip 4,565 üçlü ek dizisinin ek dizisinin herhangi bir yerindeki sıklığı (Kaynak: BÜ Derlemi)
suffix_trigram_frequencies_template-final.zip 3,948 üçlü ek dizisinin ek dizisi sonlarındaki sıklığı (Kaynak: BÜ Derlemi)
suffix_trigram_frequencies_template-initial.zip 4,414 üçlü ek dizisinin ek dizisi başlarındaki sıklığı (Kaynak: BÜ Derlemi)
non-words_CV.zip Türkçede geçerli bir kelime teşkil etmeyen tüm CV (sessiz-sesli) dizileri ve bir harf değiştirilerek, bir harf eklenerek, bir harf çıkarılarak veya iki harfin yeri değiştirilerek elde edilebilen "komşu" kelimeleri (Kelime listesi: KelimetriK)
non-words_VC.zip Türkçede geçerli bir kelime teşkil etmeyen tüm VC (sesli-sessiz) dizileri ve bir harf değiştirilerek, bir harf eklenerek, bir harf çıkarılarak veya iki harfin yeri değiştirilerek elde edilebilen "komşu" kelimeleri (Kelime listesi: KelimetriK)
non-words_CVC.zip Türkçede geçerli bir kelime teşkil etmeyen tüm CVC (sessiz-sesli-sessiz) dizileri ve bir harf değiştirilerek, bir harf eklenerek, bir harf çıkarılarak veya iki harfin yeri değiştirilerek elde edilebilen "komşu" kelimeleri (Kelime listesi: KelimetriK)
non-words_VCV.zip Türkçede geçerli bir kelime teşkil etmeyen tüm VCV (sesli-sessiz-sesli) dizileri ve bir harf değiştirilerek, bir harf eklenerek, bir harf çıkarılarak veya iki harfin yeri değiştirilerek elde edilebilen "komşu" kelimeleri (Kelime listesi: KelimetriK)
non-words_VCC.zip Türkçede geçerli bir kelime teşkil etmeyen tüm VCC (sesli-sessiz-sessiz) dizileri ve bir harf değiştirilerek, bir harf eklenerek, bir harf çıkarılarak veya iki harfin yeri değiştirilerek elde edilebilen "komşu" kelimeleri (Kelime listesi: KelimetriK)
non-words_CVCV.zip Türkçede geçerli bir kelime teşkil etmeyen tüm CVCV (sessiz-sesli-sessiz-sesli) dizileri ve bir harf değiştirilerek, bir harf eklenerek, bir harf çıkarılarak veya iki harfin yeri değiştirilerek elde edilebilen "komşu" kelimeleri (Kelime listesi: KelimetriK)
non-words_VCVC.zip Türkçede geçerli bir kelime teşkil etmeyen tüm VCVC (sesli-sessiz-sesli-sessiz) dizileri ve bir harf değiştirilerek, bir harf eklenerek, bir harf çıkarılarak veya iki harfin yeri değiştirilerek elde edilebilen "komşu" kelimeleri (Kelime listesi: KelimetriK)
non-words_CVCVC.zip Türkçede geçerli bir kelime teşkil etmeyen tüm CVCVC (sessiz-sesli-sessiz-sesli-sessiz) dizileri ve bir harf değiştirilerek, bir harf eklenerek, bir harf çıkarılarak veya iki harfin yeri değiştirilerek elde edilebilen "komşu" kelimeleri (Kelime listesi: KelimetriK)
non-words_CVCCV.zip Türkçede geçerli bir kelime teşkil etmeyen tüm CVCCV (sessiz-sesli-sessiz-sessiz-sesli) dizileri ve bir harf değiştirilerek, bir harf eklenerek, bir harf çıkarılarak veya iki harfin yeri değiştirilerek elde edilebilen "komşu" kelimeleri (Kelime listesi: KelimetriK)
zargan_lexical_database_for_turkish.zip Tüm veri setlerini içeren ZIP dosyası