BAŞA DÖN

ONTOLOJİ NEDİR

1  ONTOLOJİ NEDİR

1.1 Taksonomi ve Ontoloji

Ontoloji bazen taksonomi ile karıştırılabilmektedir. Taksonomi bir alana (domain) ait verilerin sınıflanmasından ibarettir. Ontoloji ise daha geniş olup; kavramlar arasındaki ilişkiler ile kısıtları tanımlayarak bilginin ortak bir terminoloji kullanılarak paylaşılmasını sağlar.

Örneğin belge  ve doküman yönetimi alanında bir ontoloji tanımlanmak istenirse; belgeler, belge türleri ve aralarındaki ilişkiler ile kısıtların tanımlanması yeterli olacaktır. Dolayısıyla her alana özgü ontolojiler de birbirinden farklı olacaktır.

1.2 Varlık Felsefesi Olarak Ontoloji Kavramı

Ontoloji (varlık felsefesi) varlığı var olmak bakımından ve ne olduğunu inceleyen, varlığın temel özelliklerini konu alan felsefe dalıdır. Ontoloji; bir şeyin genel olarak özünü, cismin özünü, özelliklerin özünü, ilişkilerin özünü araştırırken “Bir şey nedir?”, “Bir özellik nedir?” ve “Bir ilişki nedir?” sorularını cevaplamaya çalışır. Bu türden sorulara verilecek cevaplar ‘şey’, ‘cisim’, ‘ilişki’ terimlerinin “Bir cisim şu şudur” gibi tanımlarından ibarettir. Felsefe soyut varlığı ele almasına karşın bilim, bunun aksine somut varlığı ele alır ve bunu bir bütün olarak değil parçalara ayırarak inceler.

1.3 Bilgi Teknolojilerinde Ontoloji Kavramı

Bilgi teknolojileri alanında ontoloji belirli bir bilgi alanındaki (domain) varlıkların, kavramsal olarak anlamlarını ve aralarındaki ilişkileri içeren bir sözlük olarak tanımlanabilir. Veri ve bilginin anlamını ifade ederek bilgisayarlara (yazılım) tanıtmak ontoloji kullanmak ile başarılabilir. Ancak, böylelikle veri/bilgi, etmen (agent) yazılımlar veya çıkarsama servisleri tarafından algılanıp kullanılabilir.

Burada bilgi alanından kasıt, ortak kavramların kullanıldığı süreçler veya alanlardır. Ontoloji, sadece sınıflar hakkında bilgi içermekle kalmayıp aynı zamanda sınıfların öznitelikleri, sınıf ve öznitelikler arasındaki ilişkiler ile sınıf ve özniteliklerin birer örneklerini içerir. Bu çalışma kapsamında özniteliklere ait örnek değerler yapılmamıştır. Ontoloji, bir veri/bilgi etki alanı oluşturmak amacıyla, kavramlar veya nesne sınıfları tanımlamak için kullanılan bir dil veya mekanizmadır. Ontolojilerin ana özelliklerinden birisi diğer ontolojiler tarafından kullanılabilmesidir.

Ontoloji ortak bir kavramsallaştırmanın açık ve biçimsel gösterimidir[1]. Kavramsallaştırma, dünya üzerinde gözlemlenebilen herhangi bir olaya veya duruma ait kavramların belirlenmesiyle, bu olay veya durumun soyut bir modelini oluşturma anlamına gelir. Gösterimin açık olması, kullanılan kavramların tipinin ve bu kavramların kullanımıyla ilgili kısıtların açıkça belirtilmesidir. Biçimsel gösterim, yaratılan ontolojinin makineler tarafından okunabildiği anlamına gelir.

Kavramsallaştırmanın ortak olması ise, ontolojinin genel olarak kabul edilmiş bilgiyi modellemesi  olarak algılanabilir. Ontolojiler, tanımlamalar ve sınıflar olmak üzere iki yapı ile ifade edilirler.

Tanımlamalar, uzmanlar tarafından geliştirilirler ve ayırt edici özelliklerine (bölümler, fonksiyonlar ve öznitelik bilgileri) ve anlamsal ilişkilerine (parçasıdır, bütünüdür, bir –şey-dir/dır) göre depolanırlar. Bu yapı vasıtasıyla mevcut bilginin anlamı hakkında bilgi sağlanır. Bu sayede kullanıcılar, veri tabanında ne olduğunu sorgulayarak öğrenebilirler. Sınıflar ise, ontolojilerin gerçeklenmesinin bir sonucudur. Ontolojiler, değişik alanların belirli özelliklerini tanımlamak için sınıflandırılabilir.

Bilgisayar biliminde ontolojiler;

  • Üst seviye ontolojiler
  • Orta seviye ontolojiler
  • Alan ontolojileri

olarak üç grupta toplanırlar.

Üst seviye ontolojiler, orta seviye ve alan ontolojilerinin her ikisi için de kullanılabilecek kavramları kapsamaktadır. Üst seviye ontolojisi bütün alanlarda aynı olan çok genel kavramları tanımlar. Genellikle bu kavramlar, bütün alanlarda benzer olan varlıklar ve kurallar sınıflarından oluşmaktadır. Üst seviye ontolojiler, farklı kaynaklardan elde edilen heterojen bilginin birleştirilmesinde anahtar bir teknoloji olarak kullanılmaktadır. Üst seviye ontolojilerinin kullanım amacı, ontolojiler arasında anlamsal birlikte çalışabilirliğin desteklenmesidir. Daha belirli alan ontolojileri için bir temel role sahiptir.

Bazı üst seviye ontolojiler ile üst veri standartlarının bazı temel elemanlarının eşlenmesine ihtiyaç duyulmaktadır. Bu eşleme işlemi, üst veri elemanlarının tanımlayıcı özelliklerinin geliştirilmesine yardımcı olmaktadır. Dublin Core, web ortamında bilgi kaynaklarının tanımlanması için kullanılan bir üst veri standardıdır. On beş adet üst veri elemanından oluşan bir kümedir. Elektronik belge yönetim standardıyla belirlenen üst veriler de belgelerin tanımlanması için kullanılan bir küme oluşturur. Üst veri elemanları için temel modeller olarak üst seviye ontolojilerin kullanımı, bilgi gösteriminin yeniden kullanımı için önemlidir.

Orta seviye ontolojiler, alan ontolojileri içinde belirlenen alt seviyedeki alana özel kavramlar ile üst seviye ontolojilerinde tanımlı soyut kavramlar arasında bir köprü görevi görmektedir. Herhangi bir seviyede ontoloji eşlemesi gerçekleşebilir. Orta seviye ontolojiler ile üst seviye ontolojiler arasındaki eşleme alanları arasında kavramlar eşlemeyi sağlar. Orta seviye ontolojiler, üst seviye ontolojilerindeki soyut kavramların daha somut gösterim şeklidir. Böylece bu ontoloji kategorisi, ortak olarak kullanılan kavramları gösteren ontoloji kümelerini kapsar. Orta seviye ve üst seviye ontolojilerin kullanımı, alan ontolojilerinin eşlenmesi veya birleştirilmesi işlemlerinde kolaylıklar sağlamaktadır.

Alan ontolojisi ise, belirli alana özel kavramları ve kavramların ilişkilerini gösterir. Aynı kavramlar birçok alanda varken, kavramların gösterimi alan içeriklerinin farklılıklarından dolayı değişmektedir. Alan ontolojileri, orta seviye veya üst seviye ontolojilerinde tanımlanan kavramların eklenmesiyle genişleyebilir. Daha belirli alan ontolojileri için üst seviye ontolojileri temel rol oynamaktadır.

1.4 Ontolojiye Neden İhtiyaç Duyulur

Web’de anahtar kelimeye dayalı olarak bilgiye erişim sunan arama motorları günümüz web siteleri için kullanılan temel araçlardır. Web siteleri için kullanılan bu araçlar, bilgi yönetiminde büyük başarılar sağlayamamaktadır.

Bunun nedenleri aşağıda sıralanmıştır:

  • Bilgi arama

Web sitelerinde bilgi araması genellikle anahtar kelimelere dayanan arama motorları sayesinde gerçekleşir. Anahtar kelimeye dayalı olarak bilgi arama sürecinde kişi ve kurumların konuyla doğrudan ilgili bilgilere ulaşması zordur.

  • Bilgiye erişim

Web siteleri için anahtar kelimeye dayalı tarama sayesinde belgelere ulaşım, hem zaman hem de enerji kaybı anlamına gelmektedir. Anahtar kelimeye dayalı aramalar, farklı anlamlara sahip, fakat yazılışları aynı olan terimlerin yer aldığı konuyla ilgili olmayan gereksiz birçok bilgiye erişim sağlar. Aynı şekilde, aynı anlama gelip farklı terimlerle ifade edilen bilgilere de erişimi engeller.

  • Bilgi ediniminin sürdürülmesi

Web sitelerinde aranan bilgilere ilişkin terminolojideki tutarsızlıklar olumsuzluğa neden olur.

  • Bilginin açığa çıkışı ve görülmesi

Kurumlara ilişkin veri tabanlarındaki mevcut yeni bilgilerin veri madenciliği kullanılarak alenen ortaya çıkışı bir olumsuzluktur. Yine belli bilgiler saklansa bile web üzerinde yer alan veri tabanlarından bilgiye erişilebilmesi mümkündür. Bu durum kurum ve çalışanlarına ait bazı bilgilere erişimin sınırlandırılmasını gerektirmektedir,

Günümüz web sitelerine ilişkin tüm bu olumsuzluklar, bilgi yönetimi sistemlerinde önemli zayıflıklar olduğunu göstermektedir. Semantik web teknolojileri bu olumsuzluklara çözüm olarak düşünülmektedir.

1.5 Anlamsal (Semantik) Web

Anlamsal web’in (web 3.0) temel yapı taşı kavramları ve ilişkileri tanımlayan ontolojilerdir. Anlamsal web, web’deki veriyi hem insanların okuyabileceği hem de makinelerin anlayabileceği şekilde tanımlar ve bağlar. Bilgi gösterimi, bilgi getirme, veritabanları, çok etmenli sistemler, doğal dil işleme ve makine öğrenimi gibi birçok alanı kapsayan anlamsal web, web bilgisinin anlamını modeller.

Web sitelerinin 1990–2000 yılları arasındaki dönemi kapsayan ilk jenerasyonu HTML sayfalarının sunucu üzerinden yayınlanması biçimindedir. 2000 yılında başlayan web 2.0 ise, önceki jenerasyondan daha dinamik ve daha interaktif  belgelerin yer aldığı sitelerden oluşur. Anlamsal web öncesi web siteleri, insanların okuması için bilginin nasıl gösterileceğini ve web sayfalarında bu bilgilerin nasıl düzenleneceğini tanımlayan HTML’ ye dayanmaktadır. HTML’ ye dayalı web sitelerinde bilgiye erişim manüel olarak girilen anahtar kelimelerle sınırlıdır ve mevcut bilgilerin çoğu doğal dilde sunulmaktadır. Merkezinde insan, makine ve bilgi olmakla birlikte web 2.0, insan öğesi olmaksızın verileri anlayamaz ve geliştiremez.

Web 2.0’ın söz konusu zorluklarına karşın, bilgiyi makinece yorumlayabilen yeni nesil web siteleri olarak bilinen anlamsal web (web 3.0) gündeme gelmiştir. Web 3.0, bilginin makineler (programlar) tarafından yorumlanmasına imkân tanır. Böylece makineler, belgeler arasındaki mevcut bağlantıları bildirmekten ziyade farklı bilgi kaynakları arasındaki ilişkiyi kurabilirler.

Anlamsal web iki konu ile yakından ilgilidir:

  • Verinin değişimi için ortak formatlar,
  • Verinin gerçek nesneler ile ilgisini kuran programlama dili.

1.6 Anlamsal Web ve Ontoloji

Anlamsal web, bilgi sunumu için standart olarak ontolojiyi kullanır. Ontolojiler, insanlar tarafından oluşturulan sembollerin anlamlarının makinelerce işlenmesini sağlar. Böylece bilgi, anlamsal web üzerinde paylaşılabilir, tekrar kullanılır ve değiştirilebilir. Web ontolojisi, web üzerindeki bir alanda (domain, özel bir konuya ait bilgi alanı), paylaşılabilinir bilgiye ulaşmak isteyen ihtiyaç sahiplerine nesnelerin kurallı tanımını yaparak ortak kelimeler ve anlamlar sunmaktadır.

Ontolojiler genel olarak terimlerin sınırlı bir listesi ile bu terimlerin arasındaki ilişkilerden ibarettir. Ontolojiler sayesinde özellikle anlamsal web etmenleri, eriştikleri bilgiyi yorumlayabilirler ve diğer etmenlerle iletişim kurarak web hizmetlerini geliştirebilirler.

Farklı veri tabanlarında, aynı kavram için farklı tanımlar kullanılmaktadır. Anlamsal web’de ontolojiler kullanılarak bu tür problemler çözülmeye çalışılmaktadır. Bir anlamsal web dokümanında mevcut olan terimlerin anlamları ve bu terimler arası ilişkiler, hazırlanacak olan bir ontoloji ile anlaşılabilir hale getirilmektedir. Anlamsal web’de aynı kavram için farklı tanımların kullanımından kaynaklanan sorunlar ontolojiler kullanılarak ortadan kaldırılmaktadır.

Bir tanımı ontoloji olarak adlandırmak için aşağıdaki özelliklerin mevcut olması gerekmektedir:

  • Sınırlı kontrollü sözlükler
  • Belirli anlamdaki terim ve sınıf ilişkileri
  • Sınıflar arasındaki hiyerarşik alt sınıf ilişkileri

Zorunlu olmayan özellikler ise şunlardır:

  • Her sınıf için özellik tanımlamaları
  • Ontolojiye bireysel olarak dâhil olma
  • Her sınıf için değer kısıtlama tanımı

Olması arzulanan, fakat zorunlu ve tipik olmayan özellikler şunlardır:

  • Ayrık sınıfların tanımlanması
  • Terimler arası mantıksal ilişkilerin tanımlanması

Anlamsal web’in sunacağı hizmetlerin gerçekleştirilmesinde şu anki web’e anlam eklenmesini sağlayacak yeni dillerin tanımlanması şarttır. Anlamsal web için hazırlanacak dillerin üç özelliği içermesi gerekmektedir:

  • İçeriklerinin otomatik olarak işlenebilmesini sağlayacak biçimsel sözdizimleri (“syntax”),
  • Biçimsel anlamsallar (“semantic”),
  • Etmenlerin ve insanların bilgi paylaşımını sağlayacak standartlaşmış sözlükler.

2  ONTOLOJİ DİLLERİ

2.1 Giriş

Ontoloji dilleri genelde; ontoloji geliştirmek ve ontoloji yardımıyla web ortamındaki nesneleri tanımlamak için kullanılmaktadır, bu ise RDF’ dir. İlk RDF, web 3.0’ın temel dili olup verileri ve üst veriyi tanımlamak için kullanılmıştır. Ayrıca RDF, grafik veri formatı da kullanır. RDF grafiği, hemen her veri başlığının URI olarak isimlendirilen tek bir veri tanımlayıcısına sahip olduğu hem de her veri başlığının, diğer başlıklarla bağlantı kurulabileceği fikrine dayanır. Bu yüzden semantik web programcıları URI’ li veriler yaratırlar; URI’ lerle isimlendirilen ilişkileri kullanarak bu verileri birbirlerine bağlarlar. Böylelikle veriler, RDF ve popüler ontoloji belirleme dili olan OWL (Web Ontology Language) kullanılarak tanımlanıp birbirlerine bağlanabilirler. Aşağıda Ontoloji dilleri ilgili detaylara yer verilmiştir.

2.2 Ontoloji Dilleri

Aşağıdaki ontoloji dilleri geliştirilmiştir:

RDF: RDF (Resource Description Framework) bilgisayarlarca işlenecek verinin anlamını temsil edecek olan bir veri modelinin düzenlenmesini sağlamaktadır. RDFS (RDF Schema) gösterimi ise,  RDF veri modelini genişleterek, alanda kullanılacak sözcük kümesini nesneler, nesneler arası ilişkiler, özellikler ve özelliklerin alabileceği değerler açısından tanımlamaktadır.

RDF, XML üzerine inşa edilmiştir. W3C, XML’ i HTML’ nin genişletilmiş bir versiyonu olarak veri depolama amacıyla oluşturmuştur. XML, veri depolama ve web üzerinden veri değişimine imkân tanır; ancak, verinin anlamı hakkında hiçbir şey söyleyemez. Yani XML, yetersizdir ve aynı anlama gelen farklı terimleri anlayamaz. Örneğin <fiyat>120 TL</fiyat> ile <ücret>120 TL</ücret> etiketlerinin aynı anlama sahip olabileceğini programlar anlayamaz. Bu noktada ontolojiler gibi semantik web teknolojilerine ihtiyaç duyulur.

OWL: W3C tarafından 2002 yılında geliştirilen OWL (Web Ontology Language) yaygın olarak kullanılmaktadır. RDF(S)’e göre daha güçlü bir çıkarsama mekanizması sunarlar.

OWL, ontolojileri tanımlamak ve çeşitlemek için kullanılan bir dildir. OWL, bilginin içeriğini sadece insanlara gösteren değil, bunun yanında bilgisayarlar tarafından işlenebilmek üzere tasarlanmıştır. OWL, XML, RDF ve RDF-S tarafından desteklenen web içeriğinin bilgisayarlar tarafından daha iyi yorumlanabilmesini sağlamayı hedef almaktadır. OWL; OIL ve DAML+OIL gibi dilleri temel alır. OWL, DAML+OIL web ontoloji dilinin araştırma tabanlı bir sürümüdür. OWL dilinde terimler arasındaki bağlantı RDF söz dizimi ile yapılmaktadır. Söz dizim kuralları bilgiyi anlamlaştırmak için tasarlanmıştır.

OWL üç alt dile sahiptir: OWL Full, OWL DL ve OWL Lite. Bu üç dil, kullanıcılar için özel olarak tasarlanmıştır.

OWL Full: Tanımlama bilgisinin hesaplama bilgisinden önemli olduğu durumlarda kullanılabilir. RDF ve RDF(S)’in bütün bileşenlerinden yararlanır. RDF’ in sağladığı tüm kolaylıkları sağlar, ancak hesaplanabilirliği desteklemez, tam kararlı olmadıklarından kavramlar arasında tam ve etkili bir mantık yürütemez.

OWL DL: OWL Full’ un bir alt dilidir; terimlerin anlamlarını tanımlamada kolaylık sağlayıp, otomatik hesaplamaları mümkün kılar. OWL ve RDF’ i oluşturan yapılara kısıtlar ekleyerek kullanılır. Bu kısıtlar tanımlama mantığı bağlantısını sağlar.

OWL Lite: OWL dilinin tek bir kısmı ile OWL DL’nin kısıtlarını kullanır. OWL Lite, sadece üst sınıfı tanımlar. Üst sınıflarında karar yapıları kullanılır. Sınıflar arasında eşitlik ve alt sınıf ilişkileri vardır. OWL Lite mantıksal sonuçlarını değerlendirerek iki değer gönderir. Bu değerler 0 ve 1 dir. Özellikle durum belirteçlerinde eğer bir çıkarım varsa 1, diğer durumlar 0 kabul edilir. Örneğin bir bilgisayarın sahip olduğu işlemci, ana kart, ram belleğine bakıldığında sunucu özelliği varsa 1, diğer durumlarda 0 değeri gönderilir.

DAML, OIL: Bu bir semantik web ontoloji dilidir ve ABD Hükümetinin desteği ile DAML (DARPA Agent Markup Language) ve Avrupa Birliği tarafından geliştirilen OIL (Ontology Interface Layer) ontoloji geliştirme dilleri de tanımlanmıştır. ABD ve AB tarafından ilk olarak 2000 yılında geliştirilen ve 2001 yılında da son sürümü yayınlanan DAML+OIL dili de pek çok araştırıcı tarafından kullanılmaktadır.  En temel amacı ise web üzerinde bulunan bilginin bilgisayarların anlayacağı hale getirilmesidir.

3  ONTOLOJİ ALANINDA YAPILMIŞ ÇALIŞMALAR

3.1 Giriş

Bu kısımda belge ontolojisine en yakın örnekleri kapsaması bakımından uluslar arası literatürde yapılmış olan doküman ontoloji çalışmalarından örnekler verilecektir.

Doküman Ontolojisi çalışmaları özellikle son yıllarda hızla kullanılmaya başlamış olup özellikle de bilgi ve belge yönetimi alanında paylaşılabilinir bilgiye örneğin e-belge, dijital doküman’a ulaşmak isteyen ihtiyaç sahiplerine bu bilgilerin kurallı tanımlarının yapılarak ortak kelimeler ve anlamlar bütünlüğü içinde sunulmasını kapsamaktadır.

Dokümanların kullanım yerine göre farklı farklı doküman ontolojileri tasarlanmıştır, bu çalışmalardan bazıları aşağıdaki paragrafta anlatılmaya çalışılmıştır.

3.2 Semantik Doküman Mimarisi Doküman Ontolojisi

Semantik doküman mimarisi doküman ontolojisinin [5] amacı web üzerindeki dokümanların tıpkı ofis dokümanları gibi işlenmesini sağlamaktır. Bunun için üç tür ontoloji geliştirilmiştir;

  • Doküman Ontolojisi: Web ortamında dokümanları tanımlamak için kullanılır.
  • Doküman Değişimi Ontolojisi: Web ortamında bulunan dokümanların transferleri için kullanılır.
  • Kullanıcı Model Ontoloji: Dokümanların kullanıcılara sunumları sağlamak için kullanılır, her kullanıcıya farklı sunum yapılabilmesini sağlar.

Bu doküman ontolojisi düğüm noktaları dokümanlara ait birimleri temsil eden bir graf şeklinde sunulurlar (DU:Document Unit). Doküman Birimlerinin tipini ve dokümanlar arasındaki ilişkileri içerik birimi (CU: Content Unit) ile Bilgi Birimi (KU: Knowledge Unit) kavramları belirtilmektedir.

İçerik Birimi dokümana ait dijital içerik bilgisini, farklı formlarda sunar; örneğin Grafik, Metin, Ses ve Video formatları şeklinde. Buna karşılık Bilgi Birimi ise; bu içeriğin toplu kümesini sunarak  içerik birimleri arasında dolaşımı sağlar; örneğin paragraf, bölüm, tablo arasındaki geçişler.  Bir paragraf birkaç metin fragmanından ve grafiklerin belli sıralamasından meydana gelebilir. Buna ilaveten içerik birimleri arasındaki ilişkileri de tanımlar bunlar; dokümana ait tür, kavram, konu ve özelliklerdir.

Aşağıdaki şekilde bu tür bir doküman Ontolojisi verilmiştir.

Şekil 1: Semantik Doküman Mimarisi Doküman Ontolojisi

3.3 SALT Doküman Ontolojisi

SALT (Semantic Annotated LaTeX) [6] semantik yayın çıkarma çerçevesini sunarak, ek açıklamalar ile bilimsel yayınları zenginleştirmeyi hedefler. SALT doküman ontolojisi (SDO) bilimsel yayınların lineer yapısını belirleyerek yayın içeriklerinin tanımlanabilmesinde ve revizyonlarının yapılıp izlenmesinde yardımcı olur. Ana hedefi ise bilimsel yayınların içerik modelini farklı boyutlarda/seviyelerde sunmaktır. Bu ontoloji dokümanlar üzerindeki içerik örneklerinin birbirleri ile ilişkilendirilmesinden ibarettir, bunun için hasText (İçerir) özelliği tanımlanmıştır. Aşağıdaki şekil bu ontolojiyi tasvir eder, ayrıca dokümanlara ilişkin kavramlar ve özellikleri de detaylı olarak veren bir ontoloji modelidir.

Şekil 2: SALT Doküman Ontolojisi

SDO ontolojisi ilk önce sistem içinde var olan nesneleri ve özellikleri belirleyerek işe başlar.

Örneğin yukarıdaki ontoloji modeli için bir varlık listesi oluşturulmuş daha sonra da bu varlık listesindeki sınıflar ve özellikler detaylandırılmıştır, sistemin en üstündeki sınıf ise kaynak (Resource), sınıfı olup şekilde verilmemiştir diğer tüm sınıflar bu sınıfın altsınıfıdır.

Varlık listesi: Sınıflar ve Özellikleri

Classes

Publication, Section, Paragraph, Sentence, TextChunk, Revision, Table, Figure

Properties

hasSection, hasSubSection, hasParagraph, hasSentence, hasTextChunk, hasRevision, hasOrderNumber, hasStartPointer, hasEndPointer, hasSectionTitle, hasCaption, hasTable, hasFigure, hasRevisionDate, hasLocation, hasAnnotation, hasSALTVersion


Ontoloji sınıflarını tanımlamak:
Publication

Superclasses

rdfs:Resource

Subclasses

--

In domain of:

sdo:hasSection, sdo:hasSALTVersion, sdo:hasLocation, sao:cites, sao:isCitedBy, sao:hasCitationKey, sao:hasCitationContext

In range of:

sao:cites, sao:isCitedBy, sao:pointsTo


Ontoloji özelliklerinin tanımlanması:
hasSection

Type

rdf:Property, rdfs:Resource

Domain

sdo:Publication

Range

sdo:Section


3.4 Ajan Tabanlı RDF(S) Doküman Ontolojisi

Ajan Tabanlı Doküman Ontolojisi [7] yüksek öğrenim ortamında bilgi kaynaklarına erişim için tasarlanan ajan mimari tabanlı bir sistemdir. Burada öğrenciler ve öğretim elemanları tarafından üretilen/kullanılan tüm dokümanlar RDFS (Resource Definition Framework Schema) kullanarak tanımlanmaktadır. Bu modelde; farklı işlevleri gerçekleştiren üç ajan (agent) bulunmaktadır, kullanıcı ile etkileşim, ontolojinin düzenlenmesi ve üstveri kullanarak arama yapma.

Bir yüksek öğrenim kurumundaki öğrenciler değişik bilgi ve belge kaynaklarına hem erişirler hem de bu tür bilgi ve belge üretirler. Öğrenim bilgi yoğunluklu bir aktivite olduğu için bilgi yönetimi ve bilginin kayıt edilmesi büyük önem taşır. Bilginin tanımlanması ve bilgi kaynaklarının oluşturulması önem arz eder. Bu nedenle bilgi yönetim teknolojileri ve stratejilerinin uygulanması onların gelecekteki eğitim aktivitelerine önemli katkılar sağlayacaktır. Kullanılmakta olan DCMI (Dublin Core Metadata Initiative) ve RDF (Resource Description Framework) ve OWL (Ontology Web Langauage) metodolojileri farklı dokümanları tanımlamak ve kategorize etmek için önemlidir (ev ödevi, makale yazma, raporlama). İşte bu nedenle doğru ontolojinin geliştirilmesi yardımıyla dokümanların yönetimi için gerekli araçların geliştirilmesi yapılabilir.

Bu ontolojide öncelikle sistemde kayıt altına alınacak olan dokümanlar ve doküman tiplerinin belirlenmesi çalışması ile doküman taksonomi hiyerarşisi yapılır.[7]. En yukarıda kök olarak da adlandıran üst doküman sınıfı bulunur, alt dallarda ise ilgili köke bağlı dokümanları karakterize eden dokümanlar bulunur, bunlar en soyut hali ile verilirler. Bu tür bir taksonomi çalışmasında dokümanlara ait ortak özellikler belirlenerek dokümanların tanımlamalarına yardımcı olunur. Örneğin bir doküman içinde en azından şu özellikler bulunur; başlık, içerik tanımı, yazarı gibi. Farklı bir bakış açısı ile de dokümana ait tek bir öznitelik belirlenerek diğer dokümanlarla olan ilişkisi belirlenebilir. Bu dokümanlara ait öznitelik sınıflarının belirlenmesi ile farklı kavramsal içerikleri bulunan dokümanların ortak özellikler kullanılarak etkin ve hızlı erişimi sağlanabilir. Aşağıdaki şekilde bu tür bir ontolojinin sunumu verilmiştir.

Şekil 3:Yüksek Öğrenim Doküman Ontolojisi

Bu ontolojide bazı özellikleri doküman tipleri arasında paylaşılmakta hem de bu özellikler dokümanların tanımlanmasına yardımcı olmaktadır. Örneğin her dokümanda olması gereken özellikler şunlardır; başlık (title), tanım (description) ve kaynak yeri (URL). Buna ek olarak dokümanın domain ontoloji içinde diğer dokümanlarla ilişkisini belirten hasConcept (vardır) özelliği bulunur.

Yukarıdaki şekilde bu tür bir ontoloji modeli verilmiştir, burada doküman (document) hiyerarşinin en üstünde yer alır (root) diğer dokümanlar sadece soyut olarak verilmişlerdir. Şekil içindeki diğer sınıflar olan assignment, report ve notes ise document sınıfının bir altsınıfıdır. Bu kavramlar ilgili alana özgü özel dokümanları tanımlarlar ve böylece de birbiri ile ilişkili dokümanlara ve kavramlara erişim kolayca sağlanabilir. Aşağıdaki şekilde bir dokümanın özelliklerinin birbirleriyle olan ilişkisi verilmiştir.

Şekil 4: Bir dokümana ait özellikler ve ilişkileri

Bu tür doküman ontolojileri RDF[3] (Resource Description Framework) veya RDFS[4] kullanılarak sunulurlar. Bu modelde bilgi kaynaklarının semantik olarak sunumu standart XML kullanılarak yapılmaktadır. Bu model üç ana öğe üzerine kurulmuştur; kaynak, öznitelik ve değer (resource, property, value), bu ise o dokümana ait üstveriyi ifade eder. Bu stratejinin odaklandığı nokta ise bu ontolojinin bir işaretleme dili olan XML ile nasıl sunulacağı, nasıl paylaşılacağı ile farklı kullanıcılar için tekrar kullanılabilirlik konularıdır. Bu tür bir doküman ontolojisi aşağıdaki gibi sunulabilir; burada doküman, ödev ve rapor grafa ait düğümleri gösterir ve alt sınıflar da dokümana ait sınıfları ifade eder. Burada ilişki subClass (altSınıfı) ile ifade edilmektedir, yani bir doküman bir dokümanın altsınıfı olabilir.

Şekil 5: RDF Şemasına Göre Dokümanlar ve İlişkileri

Aşağıdaki şekil (Şekil 6) bir dokümanı tanımlayan bir graf olarak verilmiştir. Bu şekilde #article01 dokümanı tanımlamak için kullanılmış olan bir ID’ dir ve rdf:type ise dokümanın tipini tanımlamak (paper) için kullanılmıştır. Bunlara ek olarak doküman özellikleri ile doküman sunulmuştur, dc:title ve doc:url.

Şekil 6: RDF Şemasına göre dokümanın graf olarak gösterilmesi

Bu doküman RDF olarak aşağıdaki gibi tanımlanabilir, burada ekstra özellik olan FOAF[8] (Friend Of a Friend) dokümana ait yazar bilgisini vermek için tanımlanmıştır.

<rdf:Description rdf:about=”#article01”>

<rdf:type rdf:resource=”#paper”/>

<dc:title>Knowledge Management for

Beginners</dc:title>

<doc:url>www.…./article01.pdf</doc:url>

<doc:hasConcept rdf:resource=”#Knowledge”/>

<author>

<foaf:person>

<foaf:name>A. Rojas</foaf:name>

<foaf:mbox>[email protected]<foaf:mbox>

</foaf:person>

</author>

</rdf:Description>


İçişleri Bakanlığı Nufus ve Vatandaşlık İdaresi Dijital Arşiv Projesi (NVİ DAP)

İçişleri Bakanlığı Nufus ve Vatandaşlık İdaresi Dijital Arşiv Projesi (NVİ DAP)

Erkyazılım, TÜBİTAK Ulusal Elektronik ve Kriptoloji Araştırma Enstitüsü, T.C. İçişleri Bakanlığı Nüfus ve Vatandaşlık İşleri (NVİ) ortaklığında Ulusal Bilim Fonu - KAMAG Projesi, %100 devlet tarafından fonlanmıştır.

01.11.2010 tarihinde başlayan ve 01.09.2013 tarihinde bitirilen proje ile;

  • Vatandaşlardan, Mahkemelerden ve diğer kurumlardan gelen taleplere daha hızlı cevap verebilecek,
  • Arşivlenmiş olan kağıt ortamındaki belgelere ulaşılması, arşivden çıkarılarak çoğaltılması ve tekrar arşivlenmesi gibi  iş akışından doğan zaman ve iş gücü kaybının önlenmesi ,
  • Kağıt ortamındaki belgelerin kurumsal fonksiyonlara ve asli düzene uygun olarak sayısal ortamda indekslenmesi,
  • Belgelerin fiziki kullanımından kaynaklanan yıpranmanın ve yok olmanın önüne geçilmesi, böylece belgelerin yok olmasından doğacak kurumsal sorumlulukların ve hak mahrumiyetlerinin önlenmesi,
  • MERNİS gibi diğer e-devlet projeleriyle birlikte çalışabilirliğine imkan tanıyan alt yapının oluşturulması  amaçlanmıştır.

Belgelerinin hızlı ve güvenilir şekilde elektronik ortama aktarılması, yönetilmesi ve paylaşılması için  e-belge yönetim ve paylaşım sisteminin geliştirilmesi hedeflenmiştir.

Nufus ve Vatandaşlık İdaresinde bulunan toplam 259.405.100 adet belge içerisinden örneklenen %1’lik 2.594.051 sayfanın; hızlı ve güvenilir şekilde elektronik ortama aktarılması, elektronik ortamda yönetilmesi, diğer kurumlar ile paylaşılması için e-belge yönetim ve paylaşım sisteminin kurulması çalışması yapılmıştır.

Aile Kütükleri (60 X 80 cm), Atik Defterler (60 X 80 cm), Dayanak Belgeleri (A5-A4), 1974 öncesi dayanak belgeleri, Vukuat Defterleri (55x 40 cm), Sicil Defterleri (55x 40 cm), Vatandaşlık Dosyaları (A4)’nın dijitalleştirilmesi için Zuetchel, Book2Net, Bookeye firmalarına ait A0, A1 ve A2 boyutlarında belge tarayacak farklı özelliklerde hassas tarama cihazları kullanılmıştır.

Tarama standartı olarak TSE 13298 T1 standartı (400 dpi sıkıştırmasız TIFF formatında ana kopya saklama) uygulanmıştır.

Kuruma özel belge Ontolijisinin geliştirilmesi, Osmanlıca el yazısı tanımlama yapılması için ARGE çalışması yapılması için Hacettep Üniversitesi, Marmara Üniversitesi, Sabancı Üniversitesi ve İstanbul Üniversitelerinden danışmanlık hizmetinin alınarak hem bilgi belge yönetimi hem de el yazısı tanıma, doğal dil işleme konularında arge çalışmaları yapılmıştır.

Document Ontologies

Aşağıdaki arge çalışmaları yapılmıştır.

  • Belge Ontolojisi
  • Osmanlıca ve Türkçe Karakter Tanıma (OCR),
  • Belgelere internet ortamında erişim,
  • MERNIS vb. e-devlet projeleriyle entegrasyon

Özellikle osmanlı belgeler üzerinde el yazısı tanıma teknikleriyle yer, tarih, şahıs isimlerinin bilgisayar tarafından tanınabilmesi için ARGE çalışmaları yapılmıştır.


OTürk Dijital Arşivleri Projesi

Klasik arşiv çalışmalarını sayısallaştırma tarafında başarılı projeler çıkarmaya devam ederken bir yandan da değerli arşiv çalışmalarının kitleler ile buluşmalarını sağlıyoruz.

Prof. Dr. Ahmet Kala tarafından hazırlanıp yönetilen "İslâm Selçuklu Osmanlı ve Türk Dünyası Belgeseli" kapsamında üretilen "OTÜRK DİJİTAL" projesi 250 binden fazla belgenin günümüz araştırmacılarına açılmasını sağlıyor.
Bazı gerçekler:
  • 1040-1950 arası zaman aralığını kapsıyor
  • Büyük ölçüde Osmanlı Türkçesi, kısmen Arapça ve Farsça arşiv ve el yazması eserlerin çevirisinden oluşuyor.
  • 3 kıta ve 8 coğrafi bölgeyi kapsıyor
  • 250 şehre, 900 Kadılık-İlçeye ait belgeleri içeriyor
  • ilk belge 1048 yılına ait
  • 250.000+ çeviri/belge sisteme aktarılıyor.
Proje sayesinde, OTürk Dijital (OD) ekibi ellerindeki çalışmaları arşiv sistemine yüklüyorlar, evraklar arşiv sisteminde kelime indeksine tabi tutuluyor ve araştırmacıların kullanımına açılacak şekilde kategorize ediliyorlar.
Araştırmacılar ise sisteme girdiklerinde, indeksler veya akıllı arama sistemi ile nokta atışı belgelere, kataloglara ulaşıp, isterlerse meta verilerini inceleyip, daha sonradan yeniden erişmek için çalışma klasörlerine ekleyebiliyorlar, dilerlerse belgeyi orjinal hali ile PDF veya JPEG olarak indirebiliyorlar.
Kurumsal ve bireysel üyelik modellerinin uygulandığı sistemde kurumlar kendi çalışanları için toplu abonelik paketleri kurgulayabiliyorlar. Böylelikle çalışanlar bağlı oldukları kurumun IP sisteminden, veya belirlediği sistemlerden kesintisiz olarak OD arşiv sistemine erişebiliyor. Örneğin Milli Kütüphane sistemlerinden OD arşivine direk erişebilirsiniz. Kurumsal yöneticiler isterlerse arşivlerin bellirli bir kısmına da erişebilecek şekilde yetki tanımı yapılabilir.
Bireysel aboneler kendileri oldukça uygun rakamlarla kredi kartı ile belge indirme hakkı satın alabilirler.
OTÜRK DİJİTAL sistemi kullanıcı özellikleri:
  • Otomatik indeks katalog yapısı
  • Akıllı arama ve tavsiye sistemi
  • Çalışma klasörleri oluşturma ve içerisine belgeler ile çalışma notları ekleme
  • İstenilen belgelerin PDF/JPEG olarak indirilebilmesi
  • Kurumsal aboneler için IP tabanlı sınırsız erişim hakkı
  • Yetkilendirilmiş erişim hakkı sistemi.
  • Bireysel aboneler için kredi kartı ile abonelik sistemi
  • Kurumsal aboneler için detay raporları
    • Hangi belgeler incelenmiş
    • Hangi belgeler indirilmiş
    • Hangi kullanıcılar sistemi kullanmış
    • Detaylı kelime, özet, belge, IP raporları.
    • Excel formatında raporlar
OTÜRK DİJİTAL sistemi yönetim özellikleri:
  • Belge aktarım sistemi
  • Otomatik indeks katalog yapısı
  • Editörler için yetkilendirilmiş kategori ağacı
  • Editörler için yetkilendirilmiş belge inceleme modülü
  • Paket Fiyat Yönetimi
  • Abone Yönetimi
  • Sözleşme Yönetimi
    • Tarih kısıtlı sözleşme oluşturabilme
    • Belgenin tam metni veya özeti üzerinden arama yapma kısıtlaması
    • IP kısıtlaması (tek IP ve/veya IP aralığı tanımları)
    • Kullanıcı sayısı kısıtlama
    • Günlük, aylık ve toplan belge indirme sınırları tanımlama
    • Katalog erişim kısıtlamaları (tüm arşivi veya belirli kısmını sözleşme kapsamına alma)
  • Hesap hareketleri takibi
  • Belge, Yayın, Yayıncı düzenleme modülleri
  • Web siteleri üzerinden belirli kelimelerin, katalogların kuruma özel olarak internet kullanıcılarına açılması özelliği.
Proje ile ilgili Prof.Dr. Ahmet Kala ile T.C. Cumhurbaşkanlığı arasında projenin Cumhurbaşkanlığı himayesine alınması yönünde çalışmalar devam etmektedir.

Arşiv Standartları Üzerine

Günümüz arşiv projeleri artık birçok disiplinin iç içe geçtiği bir hal almıştır. Daha önceleri sadece bilgi ve belge yönetimi arşivcilik konuları baz alınırken şimdilerde bilgisayar mühendisliği, veri mühendisliği, bigdata konuları sahaya katılmış durumda. Devlet otoritesi de ilgili projeleri takip ederken yeni standartlar ve genelgelerle teknolojiyi takip ederek, sektör oyuncularına yön vermeye çalışmaktadır. Aşağıda sizin için derlediğimiz bir arşiv projesinde olması gereken standart ve genelgelerinin sıralamasını hazırladık.

  • Elektronik Belge Standartları Genelgesi: 16.07.2008 tarih ve 26938 sayılı Resmi Gazete’de yayımlanmış olan 2008/16 sayılı Başbakanlık Genelgesidir.
  • TSE13298T1 Standardı:”16.07.2008 tarih ve 26938 sayılı Resmi Gazete’de yayınlanan Başbakanlık genelgesinde belirtilmiş olan TS 13298 sayılı Elektronik Belge Yönetimi Standardı”dır. T1 kapsamında TS ISO/IEC 25051 Satışa Sunulan Yazılım Ürünlerinin Kalite Özellikleri ve Değerlendirilmesi standardına uyumlu olması.
  • TS ISO 27001 Standardı: Bilgi Güvenliği Yönetim Sistemi (BGYS) standardı, tüm kuruluş türlerini (örneğin, ticari kuruluşlar, kamu kurumları, kar amaçlı olmayan kuruluşlar) kapsar. Bu standart, dokümante edilmiş bir BGYS’yi kuruluşun tüm ticari riskleri bağlamında kurmak, gerçekleştirmek, izlemek, gözden geçirmek, sürdürmek ve iyileştirmek için gereksinimleri kapsar.
  • ISO 15489 Uluslararası Belge Yönetim Standardı: Ürün uluslararası geçerliği olan bir platform olması lazım.
  • Standart Dosya Planı: 25.03.2005 tarih ve 25766 sayılı Resmi Gazete’de yayımlanarak, 2005/7 sayılı Genelge ile yürürlüğe konulan belgenin dosyalanmasına ilişkin plandır
  • DTVT Haberleşme Kodu: 10/02/2011 Tarih ve 27842 sayılı Resmi Gazete’de yayınlanarak 2011/1 sayılı Genelge ile yürürlüğe konulan, Kamu kurum ve kuruluşlarında, belgenin üretildiği kurumu ve birimi tanımlayan kodların bulunduğu Devlet Teşkilatı Veri Tabanıdır.
  • Evrak Saklama Planı ve Yönetmeliği; 3473 sayılı Muhafazasına Lüzum Kalmayan Evrak ve Malzemenin Yok Edilmesi Hakkında Kanun ve 16 Mayıs 1988 tarih ve 19816 sayılı Resmi Gazete’de yayınlanan Devlet Arşiv Hizmetleri Hakkında Yönetmeliğe uygun olarak, birimler bazında yürütülmekte olan fonksiyonların bağlı bulundukları kanun, tüzük ve yönetmeliklere dayanılarak, kurumdaki her türlü evrağı kapsayacak şekilde hazırlanmaktadır.
  • Resmi Yazışmalarda Uygulanacak Esas ve Usuller Hakkında Yönetmelik: Elektronik Belge ve Elektronik İmza tanımları ile resmi yazışmalarda Bilişim Sistemlerinin kullanımına ilişkin düzenlemelerin yer aldığı, 05.02.2015 tarihli, 29258 sayılı Resmi Gazetede yayımlanarak yürürlüğe giren yönetmeliktir.
  • 3473 Sayılı Kanun: 04.10.1988 tarih ve 19949 sayılı Resmi Gazete’de yayınlanan “Muhafazasına Lüzum Kalmayan Evrak ve Malzemenin Yok Edilmesi Hakkında Kanun Hükmünde Kararnamenin Değiştirilerek Kabulü Hakkında Kanun”u ifade eder.
  • Devlet Arşiv Hizmetleri Hakkında Yönetmelik: Başbakanlıkça yürürlüğe konulan 15.06.1988 tarih ve 19816 sayılı Resmi Gazete’de yayımlanan Yönetmeliği ifade eder.
  • Dilekçe Hakkının Kullanılmasına Dair Kanun:10.11.1984 tarih ve 18571 sayılı Resmi Gazete’de yayımlanan 3071 sayılı Kanun.
  • Bilgi Edinme Hakkı Kanunu: 24.10.2003 tarih ve 25269 sayılı Resmi Gazete’,de yayımlanan 4982 sayılı Kanun
  • Lisanslı Yazılım: 15 Temmuz 2008 tarih ve 2008/17 sayılı Başbakanlık Genelgesi.
  • Birlikte Çalışabilirlik Rehberi: Kamu Bilgi Sistemlerinde Birlikte Çalışabilirlik Esaslarına ilişkin 28 Şubat 2009 tarih ve 2009/4 sayılı Başbakanlık Genelgesi (ekinde Birlikte Çalışabilirlik Esasları Rehberi) ve ekleridir.


    T.C. Dışişleri Bakanlığı Arşiv Otomasyon Projesi İlerliyor

    T.C. Dışişleri Bakanlığı Arşiv Otomasyon Projesi hızla ilerliyor. Proje kapsamında yaptığımız çalışmaların tanıtımını yapabilmek için bakanlık nezaretinde tanıtım filmi hazırlandı. Tanıtım filminde hem bakanlık arşivinin önemi hemde ortaya çıkacak yeni bir dijital arşiv veritabanının faydaları anlatılmaktadır.

    Türkçe Tanıtım Videosu:

    ,

    Tanıtım filmini izlemek için: - https://www.youtube.com/watch?v=asAioqDafpY

    Turkish Ministry of Foreign Affairs eArchive Project presentation video:

     

    e-Archive's Project - https://diplomatic.mfa.gov.tr/ApplicationNewsDetail.aspx?id=104

    Turkish Foreign Ministry opens its diplomatic archives for researchers - http://www.armradio.am/en/2014/11/28/turkish-foreign-ministry-opens-its-diplomatic-archives-for-researchers/

    Turkish Foreign Ministry opens its diplomatic archives for researchers - http://www.hurriyetdailynews.com/turkish-foreign-ministry-opens-its-diplomatic-archives-for-researchers-.aspx?pageID=238&nID=74906&NewsCatID=338