← Ana sayfa

Kullanım Kılavuzu

Türkçenin Tarihi · sistemin tüm özellikleri ve metodolojisi

1Sistem nedir?

Türkçenin Tarihi, Türkçenin 1 300 yıllık metinsel mirasını sayısal aynaya tutan bir analitik platformdur. Yapay zekâ ve dilbilim algoritmaları, yüklenen PDF kaynakları (eserler, gramerler, sözlükler, Türkoloji çalışmaları) üzerinde otomatik olarak şu işleri yapar:

Hızlı başlama: Ana sayfa sekmelerini gezin, "Detay" sekmesinde derinlemesine metrikleri görün, "Coğrafya" sekmesinde haritada bir dönem dairesine tıklayıp profilini açın.

2Anasayfa sekmeleri

Anasayfa 7 sekmeye ayrılmıştır. Her sekme farklı bir bakış açısı sunar:

📊 Genel

Derlemin özeti: toplam eser, sayfa, kelime, tekil sözcük; dönem zaman çizgisi; dönem dağılımı donut; yazar dağılımı bar; kategori dağılımı.

📜 Metinler

Yazıt, şiir, dinî metin gibi birincil tarihsel kaynaklar. Dönemin gerçek söz varlığını yansıtır; "ek/fiil/isim" gibi gramer terimleri öne çıkmaz.

📖 Gramerler

Dilbilgisi kuralları + örnek cümlelerden oluşan akademik eserler. Bu sekmede gramer terim yoğunluğu (ek, fiil, isim, zaman) baskındır.

📚 Sözlükler

Eski Türkçe ↔ modern karşılıklar, etimolojik veriler. Sözlük tipi PDF yüklendikçe otomatik bu kategoriye düşer.

🌍 Türkoloji

Türkçenin tarihini, yayılımını, lehçelerini ele alan genel akademik çalışmalar (Tezcan, Akar, Aksan vb.).

🗺 Coğrafya

Avrasya haritası üzerinde dönemlerin edebî merkezleri (Orhon Vadisi, Kaşgar, İstanbul…). Bir noktaya tıklayınca o dönemin sesbilim+morfoloji profili açılır.

🔬 Detay

Alıntı oranı, ortalama sözcük uzunluğu, dönem özgün sözcükleri, en sık 2-gramlar, eser benzerlik matrisi (Jaccard), transkripsiyon işaretleri, en sık kelimeler.

3Detaylı arama

Anasayfanın üstünde Derlemde ara kutusu vardır. Tüm 1.5+ milyon kelime üzerinde anlık full-text arama yapar; bağlamlı sonuçlar döner.

Arama modları

ModDavranışÖrnek
kelime (varsayılan) Tam sözcük eşleşmesi (kelime sınırlı) "türk" → sadece "türk", "türkçe" eşleşmez
onek Sözcük başlangıcı eşleşmesi "türk" → türk, türkçe, türkler, türkmen…
kismi Substring (her yerde) "türk" → Atatürk, Türkçe, türkmen…

Filtreler

Sonuçlar

Her eser için match sayısı + ‰ yoğunluk (1000 kelime başına) + ilk 4 bağlam parçası gösterilir. "Tüm bağlamı göster" tıklanınca o eserdeki tüm geçişler (max 200) açılır.

İpucu: "kagan", "tengri", "yarpuz" gibi tarihsel sözcükleri dene — bağlam içinde dönemin gerçek kullanımını görürsün.

4Coğrafi harita

Coğrafya sekmesinde Avrasya haritası üzerinde Türkçenin tarihsel edebî merkezleri konumlandırılmıştır. Daireler kronolojik altın oklarla bağlanır — Türkçenin coğrafi göçünü gösterir.

Dönem merkezleri

DönemYılMerkez
Köktürkçe~732Orhon Vadisi (Moğolistan)
Eski Türkçe (Uygurca)~1000Tarım Havzası (Doğu Türkistan)
Karahanlıca~1075Kaşgar / Balasagun
Harezm-Kıpçakça~1325Harezm / Altın Orda
Eski Anadolu Türkçesi~1400Konya / Kütahya / Bursa
Çağatayca~1600Semerkant / Buhara
Osmanlıca~1700İstanbul
Modern Türkçe~1950Ankara

Dönem profili

Bir daireye tıklayınca yan panel açılır. O dönemin sesbilim ve morfoloji profilini bar grafiklerinde gösterir:

5Analitik metrikleri

Detay sekmesinde derinlemesine analizler vardır:

Alıntı yoğunluğu (heuristic)

â / î / û içeren ya da ünlü uyumu bozuk sözcüklerin oranı. Arapça/Farsça alıntıların yaklaşık göstergesi. Tarihsel U eğrisi:

Karahanlıca (öz Türkçe) → Harezm/Çağatay/Osmanlı (alıntı zirvesi) → Cumhuriyet sonrası özleştirme.

Dönem özgün sözcükleri

Bir dönemde sık geçen ama diğer dönemlerde nadir olan sözcükler. Diakronik kimlik göstergesi.

skor = (donem_freq / (1 + disar_freq)) × donem_freq

2-grams (collocations)

Derlem genelinde art arda gelen 2'li sözcük öbekleri. "kül tigin", "tengri teg", "köp er" gibi kalıpları yakalar.

Eser benzerlik matrisi

Eserler arasındaki sözcük örtüşmesi Jaccard formülüyle hesaplanır:

J(A, B) = |A ∩ B| / |A ∪ B|

Heatmap'te koyu renkler benzer söz varlığına işaret eder (aynı dönem eserleri tipik olarak yan yana koyulaşır).

Polysemy (anlam çeşitliliği)

Sözlük türü PDF'ler eklendiğinde her sözcüğün anlam sayısı hesaplanır. (Şu an metin/gramer derlemi olduğu için pasif.)

6Otomatik kategori & dönem ataması

PDF dosya adı + ilk sayfaları taranarak regex pattern kuralları üzerinden otomatik atama yapılır.

Dönem atama kuralları

DönemPatternÖrnek dosya
KöktürkçeOrhon|Tunyukuk|Kül.?Tigin|Bilge.?Kağan|ThomsenTekin_Orhon_Yazıtları.pdf
Eski TürkçeEski.?TürkçeAksan_En_Eski_Türkçenin_İzlerinde.pdf
KarahanlıcaKarahanlı|XI[._ ]+Yüzyıl|Kutadgu|Eski[_ ]Türk[_ ]Şiir|Atebet|Divan-?ı.?LArat_Kutadgu_Bilig.pdf
Harezm-KıpçakçaHarezm|Kıpçak|Nehc[uü]l|Kısas[uü]l|Rabgu?z|Rabghu?zEckmann_Nehcül_Feradis.pdf
ÇağataycaÇağatay|ÇağataycaEckmann_Çağatayca_El_Kitabı.pdf
Eski AnadoluEski.?Anadolu|Eski.?TürkiyeTimurtaş_Eski_Türkiye_Türkçesi.pdf
OsmanlıcaOsmanlıTimurtaş_Osmanlı_Türkçesi_Grameri.pdf
Modern TürkçeTürk[_ ]Dilbilgisi|Türkiye[_ ]TürkçesiEdiskun_Türk_Dilbilgisi.pdf
Türkoloji (Genel)Tuna.?Bulgar|Türk.?Dil(?:i|leri)|İpek.?Yolu|Yazımı|Türk.?Şiv|Tarihi.?Türk|Söz.?Varl|KarşılaştırmalAkalın_Tarihi_Türk_Şiveleri.pdf

Kategori atama kuralları

KategoriPattern
Gramergramer|grameri|dilbilgis|el[_ ]kitab
Sözlüksözlük|sozluk|dictionar
Metinyazıt|nehc|şiir|kül_tigin|tunyukuk_yaz|metin|kutadgu|kısas|enbiya|hikmet|hadis|atebet|divan-ı
Genelfallback
"Belirsiz" görüyorsan: Yeni eklediğin bir PDF'in ismi henüz bir patterne uymuyor. Yönetimden bildir; pattern listesi kolayca genişletilir.

7Türkolojik transkripsiyon işaretleri

Sistem 16 farklı transkripsiyon kategorisini otomatik tanır. NFC normalleştirme sayesinde PDF'ler combining diacritics (k + ̣) kullansa bile precomposed karaktere (ḳ) dönüşür.

GrupKarakterlerKullanım
Uzun ünlü (macron)ā ē ī ō ū ǖKöktürkçe / Eski Uygurca
Uzun ünlü (sirkumfleks)â ê î ô ûOsmanlıca uzun ünlü
Üstte iki noktaä ö üTürkoloji + Almanca
Sağır n / nazal velarŋ ñ ṅKafnun (ng sesi)
Damaklı ünsüz (caron)š č ž ǰ řSlav-Türkolojik
Altı noktalıḳ ḥ ḫ ṣ ḍ ṭ ẓ ẕArapça emfatikler
Üstü noktalıġ ż ḟ ṗ ḃ ċArapça gayn vb.
Hemze / Aynʿ ʾ ʼ ʽGlottal işaretler
Tildeã õ ũTilde işaretliler
Acute / Graveá é í ó ú / à è ì ò ùLatin alıntı
Halka, Breveå ů / ă ĕ ĭ ŏ ŭDiğer diakritikler
IPAə ɨ ɯ ɔ ɛDamaklı ünlü

8Yönetim paneli

/yonetim/ adresinden giriş yapılır.

Giriş bilgileri

Cookie 90 gün geçerlidir; bir kez giriş yaptıktan sonra şifre tekrar sorulmaz.

PDF yükleme

  1. Yönetim sayfasındaki "PDF Yükle" alanına dosyayı sürükle (ya da tıkla, seç).
  2. Yükleme bittiğinde otomatik analiz arka planda başlar.
  3. Üst banner'da "Analiz çalışıyor… (0:24)" canlı sayaç görünür.
  4. Tamamlanınca yeşil "Analiz tamamlandı" mesajı + eser listesi yenilenir.
  5. Anasayfa otomatik güncellenmiş halini Ctrl+Shift+R ile görebilirsin.

Duplicate kontrolü

Sistem 3 katmanlı duplicate koruması yapar:

  1. Aynı dosya adı → 409: "Aynı isimde bir dosya zaten yüklü"
  2. %PDF magic byte doğrulaması → bozuk PDF'leri elemine eder
  3. SHA256 içerik hash → aynı içerik farklı isimle yüklenirse de yakalar

Eser silme

Mevcut eserler tablosunda her satırın "Sil" butonu vardır. Onay sorusuyla siler; PDF dosyası + cache .txt dosyası birlikte silinir, bir sonraki güncelle'de derlemden çıkar.

Manuel "Güncelle"

Pattern listelerini düzenledikten sonra ya da bir sorun çıktığında "Analizi şimdi güncelle" butonu derlem_analiz.py + donem_profil.py scriptlerini yeniden çalıştırır.

9Metodoloji

PDF → metin çıkarımı

Tokenizer

Sözcük yakalama: [^\W\d_]+ (Unicode-aware Latin letter regex). 3+ harfli tokenler. ASCII + tüm Türkolojik transkripsiyon karakterlerini kapsar.

Bigram (collocations)

Stop word filtresi sonrası 3+ harfli ardışık iki token. Korpus genelinde 40+ frekanslı olanlar tutulur.

Sesbilim metrikleri

Morfoloji metrikleri

Regex tabanlı ek tespiti:

Coğrafi projeksiyon

Avrasya haritası bbox: lng [18, 115], lat [25, 56]. 980×380 px SVG. Doğrusal projeksiyon. Ülke poligonları Natural Earth 110m'den indirilmiş, basitleştirilmiş JSON.

Otomatik analiz pipeline'ı

PDF yükleme → background thread → derlem_analiz.py → donem_profil.py → derlem.json + donem_profil.json → public/'a kopyala → API memory reload

10Terimler sözlüğü

TerimAçıklama
Derlem (corpus)Sistematik biçimde derlenmiş metin külliyatı
DiakronikTarihsel zaman içinde değişimi inceleyen yaklaşım
SenkronikBelirli bir zaman diliminde sabit bir kesit
PolysemyBir sözcüğün birden fazla anlama gelmesi
Bigram / N-gramArt arda gelen N kelime / sembol kalıbı
CollocationBirlikte sık geçen kelime öbeği
Jaccard benzerliğiİki kümenin kesişiminin birleşimine oranı (0-1)
FTS (Full-Text Search)Metin içinde tam kelime / önek araması
NFC / NFDUnicode normalleştirme formları (precomposed / decomposed)
MacronUzun ünlü işareti (ā ē ī ō ū)
Sirkumfleksİnceltme/uzatma işareti (â ê î ô û)
Sağır nVelar nazal sesi (ŋ ñ); Türkçe "kafnun"
Altı noktalıArapça emfatik harfler (ḳ ḥ ḫ ṣ ḍ ṭ ẓ ẕ)
Hemze / AynArapça glottal işaretleri (ʾ ʿ)
İzoglossAynı dilbilim özelliğinin coğrafi sınırı
Sesbilim (fonoloji)Dilin ses dizgesini inceleyen alan
MorfolojiSözcük yapısı ve eklerin incelenmesi
LeksikSöz varlığı ile ilgili
TürkolojiTürk dilleri ve kültürünü inceleyen disiplin

11Sıkça sorulanlar

Yeni PDF eklediğimde manuel bir şey yapmam gerekiyor mu?

Hayır. Yükleme tamamlandığında arka planda otomatik analiz başlar. ~2-5 dakika sonra tüm 20 görsel yenilenmiş halde olur. Üst banner ilerlemeyi gösterir.

Bir eser "Belirsiz" dönemde gözüküyor — neden?

Dosya adı henüz bir dönem patternine uymuyor. Yönetime haber ver; pattern listesi analiz/derlem_analiz.py'deki DONEM_KURAL'a bir satır ekleyerek düzeltilir. Sonra "Güncelle" tetikle.

Arama "kelime" modunda neden bazı sonuçlar gelmiyor?

Kelime modu tam sözcük sınırlı arama yapar. Türkçenin eklemeli yapısı nedeniyle "türk" arıyorsan "türkler", "türkçe" gelmez. Ekleri görmek istiyorsan onek moduna geç.

Alıntı oranı %19.7 doğru mu?

Heuristic'tir, yani yaklaşık göstergedir. â/î/û içeren ya da büyük ünlü uyumu bozuk sözcükleri sayıyor. Gerçek alıntı tespiti için etimolojik sözlük entegrasyonu gerekir; şu an sıralamayı (hangi dönem daha alıntılı) doğru yansıtır.

Sözlük yüklediğimde ek bir analiz olur mu?

Evet — sözlük türü PDF eklendiğinde "Sözlükler" sekmesi otomatik dolar. İleride polysemy haritası, etimolojik bağlantılar gibi sözlüğe özel görseller eklenebilir.

Veri nasıl yedekleniyor?

PDF'ler /home/sha/docker/turkcetarih/ dizininde. JSON çıktıları analiz/derlem.json ve analiz/donem_profil.json'da. Sunucu yedeklemesi yöneticinin sorumluluğundadır.