Dokümanlar/Giriş

Giriş

Ürünün amacı ve hangi problemleri çözdüğü.

Citebase, akademik başvurularda istenen atıf kanıtlarını daha hızlı, düzenli ve denetlenebilir biçimde hazırlamak için geliştirilmiştir.

Bu sayfa, ürünün:

  • hangi problemi çözdüğünü
  • nasıl çalıştığını
  • hangi sınırlar içinde hareket ettiğini

açıkça anlatmak için hazırlanmıştır.

1. Bu Ürün Neden Var?#

Atıf kanıtı hazırlamak, sanıldığının aksine standart ve otomatik bir işlem değildir.

Bunun temel nedenleri şunlardır:

  • Akademik makalelerin büyük çoğunluğu PDF formatındadır
  • PDF’ler; yapı, metin kalitesi ve gömülü metadata açısından birbirinden çok farklıdır
  • Kaynakça düzenleri yayınevine, dergiye, dile ve disipline göre değişir
  • Metin içi atıflar farklı biçimlerde olabilir:
    • Sayısal (ör. [15], (15))
    • Yazar–yıl (ör. Smith et al., 2020)
    • Üst simge (superscript) sayılar
  • Bazı PDF’lerde:
    • Metin katmanı yoktur
    • Metin parçalanmıştır
    • Okuma sırası bozulmuştur

Bu nedenle tamamen otomatik sistemler kaçınılmaz bir tercihle karşılaşır:

  • Ya her zaman karar verir ve yanlış eşleşme (false positive) riski taşır
  • Ya da temkinli davranır ve insan onayı ister

Citebase, bu gerçekler üzerine kurulmuştur.

Amaç, atıf yapan PDF’lerden:

  • incelenebilir
  • izlenebilir
  • kurul/jüri tarafından anlaşılabilir

atıf kanıtları üretmek ve otomasyonun güvenilir olmadığı noktada kontrolü kullanıcıya bırakmaktır.

2. Sistem Ne Yapar (ve Ne Yapmaz)#

Sistem Ne Yapar?#

  • Atıf yapan makalelerin PDF’lerini kabul eder
  • PDF’lerin metin katmanını çıkarmaya çalışır
  • Kaynakça bölümlerini tespit eder (çok dilli başlıklar mümkün olduğunda desteklenir)
  • Tespit edilen referansları, kullanıcının ORCID üzerinden gelen yayınlarıyla eşleştirir

Eşleştirme mantığı:

  • DOI gibi kararlı tanımlayıcılar varsa → deterministik eşleşme
  • Tanımlayıcı yoksa → kontrollü sezgisel eşleşme

Her eşleşme için sistem:

  • Başlık / kapak sayfasını
  • Metin içinde ilk atfın geçtiği sayfayı
  • Kaynakça girdisinin bulunduğu sayfayı

görsel kanıt olarak üretir ve sayfa numaralarını kaydeder.

Bu kanıtlar, güven yeterli değilse otomatik olarak onaya kapatılır.

Manuel İnceleme ve Kontrol#

Citebase, manuel incelemeyi sürecin doğal bir parçası olarak kabul eder.

Kullanıcı:

  • Düşük güvenli eşleşmeleri onaylayabilir veya reddedebilir
  • Otomatik tespit başarısızsa, ilgili sayfaları manuel olarak işaretleyebilir
  • Kanıt görüntüleri üzerinde açık highlight alanları çizebilir

Amaç: otomasyonu zorlamak değil, doğru kanıtı üretmek.

Desteklenen Atıf Biçimleri#

Sistem özellikle şu kalıpları hedefler:

  • Sayısal atıflar: [15], (15)
  • Yazar–yıl atıfları: Smith et al., 2020
  • Metin katmanı korunmuş PDF’lerde üst simge sayısal atıflar

PDF yapısı metin çıkarımını bozuyorsa (özellikle üst simgeler ve noktalama işaretleri), sistem zorla otomatik karar vermez ve manuel incelemeye bırakır.

Sistem Ne Yapmaz?#

  • Her atfı %100 otomatik bulacağını iddia etmez
  • Bibliyometrik değerlendirme yapmaz
  • Bir atfın YÖK veya kurum kuralları kapsamında “sayılıp sayılmadığına” karar vermez
  • Metin katmanı olmayan taranmış PDF’lerde OCR yapmaz (mevcut sınırlama)
  • Kurul veya komite incelemesinin yerine geçmez

Çıktılar, incelemeyi desteklemek için tasarlanmıştır.

3. Doğruluk, Güven ve Yaklaşım#

Citebase tek bir ilkeye dayanır:

Atıf kanıtı denetlenebilir olmalıdır.

  • Kararlı tanımlayıcılar varsa → yüksek güven
  • Sezgisel eşleşmeler → düşük/orta güven olarak işaretlenir
  • Güven yetersizse → kullanıcı onayı istenir

Sistem bilinçli olarak temkinlidir:

  • Yanlış-pozitif üretmek yerine
  • Belirsizliği açıkça göstermeyi tercih eder

Eşleştirme önceliği:

  1. DOI
  2. Yapılandırılmış metadata
  3. Metin benzerliği

Her kanıt:

  • Belirli sayfa numaralarına bağlıdır
  • Hangi sayfaların neden seçildiği görülebilir
  • Manuel düzenlemeler “sessiz değişiklik” değil, açık highlight'lar olarak kaydedilir

4. Bilinen Sınırlamalar ve Gelecek#

Mevcut Sınırlamalar#

  • Metin katmanı olmayan PDF’ler erken aşamada başarısız olabilir
  • Çok sütunlu, dipnotlu veya sonnotlu kaynakçalar zorlayıcıdır
  • Üst simge atıflar biçim kaybında tespit edilemeyebilir
  • Latin dışı alfabeler ve diller arası referanslar ek sezgiler gerektirir

Ek Doğrulama Gerektiren Durumlar#

Bazı durumlarda manuel kontrol gerekebilir:

  • Benzer başlıklı birden fazla makale varsa
  • Yazar listeleri büyük ölçüde örtüşüyorsa
  • Online-first ve basılı yıl farklıysa
  • “et al.” kullanımı tutarsızsa
  • Kaynakça girdileri eksik veya bozuksa

Kapanış#

Citebase, kusursuz otomasyon iddiasında değildir.

Amacı; akademik başvurularda istenen atıf kanıtlarını şeffaf, izlenebilir ve düzenli hale getirmektir.