Anlamsal Ağ nedir - Semantic Network

'Bilgisayar' forumunda Özgür tarafından 17 Eyl 2009 tarihinde açılan konu

Konu etiketleri:
  1. Özgür

    Özgür Administrator Site Yetkilisi

    Semantic Web, web içeriklerinin sadece doğal dillerde değil, aynı zamanda ilgili yazılımlar tarafından anlaşılabilir, yorumlanabilir ve kullanılabilir bir biçimde ifade edilebileceği, böylece bu yazılımların veriyi kolayca bulmasını, paylaşmasını ve bilgiyi birleştirmesini sağlamayı amaçlayan gelişen bir internet eklentisidir.
    Semantic Web temelde, bir felsefe, bir takım tasarım prensipleri, işbirliği yapan çalışma grupları, ve yardımcı teknolojilerden oluşur. Semantic Web in bazı kısımları henüz geliştirilmemiş veya gerçekleştirilmemiş fakat gelecekte yapılması umulan öngörüler olarak ifade edilir.
    Diğer parçaları resmi açıklamalarla ifade edilmişlerdir. Bu parçalar şunlardır:

    1. RDF (Resource Description Framework)
    2. RDF/XML, N3, Turtle, N-Triples gibi çeşitli veri dönüştürme formatları
    3. RDFS (RDF Schema) gibi notasyonlar
    4. OWL (Web Ontology Language)
    Bu parçaların hepsinin, belirli bir problem uzayındaki kavramları, terimleri ve bağlantıları resmi bir biçimde ifade etmesi beklenmektedir.

    Amaç
    İnsanlar Web'i kullanarak Fince "araba" sözcüğünü bulabilir, kütüphaneden bir kitabı rezerve edebilir veya aradıkları DVD'nin en ucuzunu bulup satın alabilirler. Fakat bir bilgisayar bu işleri insan yönlendirmesi olmadan tamamlayamaz. Çünkü web sayfaları insanların okuması için yapılmıştır, makinaların değil. Semantic Web, bilgisayarlar tarafından anlaşılabilen ve böylece bilgiyi bulma, paylaşma ve birleştirme işlerindeki can sıkıcı angaryaları otomatikleştirebilir.
    Mesela, bir bilgisayarın, düz ekran HDTVlerin 40 inçten büyük olanlarının satıldığı, salı günleri saat 8'e kadar açık olan mağazaların listesini sunması sağlanabilir. Günümüzde bunu yapmak için, her siteyi ayrı bir biçimde tarayan ve indeksleyen arama motorlarına ihtiyacımız var. Semantic Web, web siteleri için bu birbiri ie bağlantılı bilgilerin makinalar tarafından işlenmesine hazır ve birleştirilebilir bir biçimde yayımlanmasını sağlayan ortak bir standart (RDF) belirlemiştir.
    Tim-Berners-Lee Semantic Web'in vizyonunu aşağıdaki gibi ifade etmiştir:
    "Web için bir hayalim var, öyle ki bilgisayarlar web üzerindeki bütün veriyi, içerikler, linkler ve insanlarla bilgisayarlar arasındaki bütün işlemler gibi, analiz etmeye muktedir olacaklar. Henüz ortaya çıkmamış olsa da, ortaya çıktığı zaman Semantic Web ticaretin günlük mekanizmaları, bürokrasi ve günlük yaşamlarımız birbiri ile konuşan makinalar tarafından yürütülecek. İnsanlığın asırlardır konuşup durduğu "akıllı ajanlar" nihayet gerçekleşecek."
    — Tim Berners-Lee, 1999
    Hypertext Web ile İlgisi

    1. Markup (İşaretleme)
    Bir bilgisayardaki dosyalar dağınık bir şekilde parçalara ayrılmış belgeler olabilir. Bu tip belgeler, e-postalar, raporlar ve broşürler insanlar tarafından okunabilir. Takvim, adres defteri, playlist ve elektronik tablo(spreadsheet) gibi veriler, bunların görüntülenmesini, araştırılmasını ve çeşitli yollarla birbirleri ile ilişkilendirilmelerini sağlayan programlar ile sunulur.
    Şu anda World Wide Web, temel olarak, metin blokları ve bunların içine serpiştirilmiş, resimler ve veri giriş formları gibi çokluortam nesnelerinden oluşan sayfaları kodlamak için kullanılan bir işaretleme dili olan Hypertext Markup Language (HTML) ile yazılmış dokümanlardan oluşur.
    Semantic Web herhangi bir verinin, özellikle veri için tasarlanmış RDF sayesinde, bilgisayardaki veri dosyaları gibi işlenebilmesine olanak sağlayacak şekilde yayınlanmasını sağlar.
    HTML dokümanları ve bu dokümanlar arasındaki bağlantıları ifade ederken, RDF, tersine, insanlar, toplantılar, uçak parçaları gibi gelişigüzel şeyleri tanımlayabilir.
    Mesela HTML ile kodlanmış bir ürün listesi düşünelim. HTML için ürün ve yanında yazan fiyat, veri parçalarından başka bir şey değildir. Ürünün hangi firma tarafından üretildiği gibi bir bilgiye ulaşamayız. HTML için içinde fiyatın yazdığı span tag ı sadece firma adının yazdığı tag in yanında durması gereken bir şeydir. Hatta HTML, bu listenin bir ürün listesi olduğunu bile söyleyemeyecektir.

    2. Tanımlayıcı ve Genişletilebilir
    Semantic Web bu eksikliği, RDF, Web Ontology Language (OWL) ve veri-merkezli, uyarlanabilir Extensible Markup Language kullanarak işaret eder. Bu teknolojiler web dokümanlarını tamamlamak ya da bunların yerine geçmek üzere birlikte kullanılır. Böylelikle veri, web'den erişilebilir veritabanlarında tanımlayıcı veri şeklinde veya gösterimle ilgili kısımları ayrı olarak tutulan saf XML şeklinde veya XHTML şeklinde tutulabilir. Makinalar tarafından okunabilir açıklamalar içerik yöneticilerinin içeriğe anlam ekleyebilmelerini sağlar. Mesela bir içerikle ilgili bilginin yapısını açıklamak gibi. Böylece, "tümdengelim uslamlaması(deductive reasoning)" ve çıkarım yapma işleyişine benzer şekilde, makine metin yerine bilginin kendisini işleyebilir. Bu sayede daha anlamlı sonuçlara ulaşılır, otomatikleştirilmiş bilgi toplama ve araştırmanın bilgisayarlar tarafından yapılması sağlanır.

    Elemanlar

    1. XML, XML Schema, RDF, OWL, SPARQL

    Semantic Web standartları ve XML, XML Schema, RDF, RDF Schema ve OWL gibi araçları kapsar.
    w3c.org daki "Web Ontology Language Review" dokümanı bu elemanların fonksiyonlarını ve bu elemanlar arasındaki ilişkileri açıklar. Burada özetleyecek olursak:


    • XML yapılandırılmış dokümanlar için yüzeysel sözdizim kuralları sağlar. Fakat dokümanın anlamı ile ilgili anlamsal kısıt yüklemez.
    • XML Schema, XML dokümanlarının yapı ve içerik elemanlarını düzenlemeye yarayan bir dildir.
    • RDF nesnelere (resources) ve bu nesnelerin nasıl ilişkili olduğuna işaret eden bir veri modelidir. RDF temelli model XML sözdiziminde ifade edilebilir.
    • RDF Schema, RDF kaynaklarının özelliklerini ve sınıflarını ifade etmeye yarayan sözcükler bütünü ve bunların genelleştirme hiyerarşileri için bir anlambiliminden oluşur.
    • OWL, özellikleri ve sınıfları betimlemek için daha fazla sözcük grubu getirir; arasında, sınıflar arası ilişkiler, cardinality, eşitlik, özelliklerin daha iyi sınıflandırılması, özelliklerin karakteristikleri ve numaralandırılmış sınıflar (enumerated classes) gibi.
    • SPARQL, semantic web veri kaynakları için bir protokol ve sorgulama dilidir.
    Web'in ve web içindeki birbiri ile bağlantılı kaynakların kullanışlılığını ve kullanılabilirliğini artırma amacını aşağıdakilerle gerçekleştiririz:

    • RDF ve SPARQL standartlarını kullanarak mevcut veri sistemlerini expose eden sunucular. Farklı uygulamalardan birçok RDF'e çevirici bulunmaktadır. İlişkisel veritabanları önemli bir kaynaktır. Semantic web server, varolan sisteme, sistemin işleyişini etkilemeden eklenebilir.
    • Semantik bilgi ile işaretlenmiş dokümanlar (HTML diline bir uzantı olarak kullanılan <****> etiketleri günümüzde arama motorları ve web crawler lar için bilgi sunmaktadır). Bu veri, insanlar tarafından anlaşılabilir içerik hakkında, makinalar tarafından anlaşılabilir bilgi olabilir. Mesela sayfanın yaratıcısı, başlık, açıklama gibi. Veya bir takım gerçekleri ifade eden saf ****data olabilir(sitenin diğer yerlerindeki kaynaklar ve servisler gibi). Semantik işaretleme genellikle elle değil, otomatik olarak gerçekleştirilir.
    • Genel ****data sözcük kümeleri (ontolojier) ve sözcük kümeleri arasındaki eşlenmeler (maps). Bunlar doküman yaratıcılarının dokümanlarını, doküman okuyan birimler tarafından anlaşılabilmesi için nasıl işaretleyeceklerini bilmelerini sağlarlar.
    • Bu veriyi kullanarak Semantic Web kullanıcıları için otomatik olarak belirli görevleri yerine getiren birimler.
    • Özellikle birimlere bilgi sağlamak için geliştirilmiş web-tabanlı servisler. (Mesela bir birimin, bir online mağazanın daha önce kötü hizmet ya da spam gönderimi ile ilişkili olup olmadığını öğrenebildiği bir Trust servisi.)
    2. RDF-URI, XML, Namespaces
    Bu teknolojinin öncelikli kolaylaştırıcıları URI ile birlikte XML ve namespace lerdir. Bunlar biraz mantık eklenerek RDF i oluşturur. RDF, herhangi bir şey hakkında herhangi bir şey söylemek için kullanılabilir. Topic Maps ve web öncesi yapay zeka gibi teknolojiler de Semantic Web e RDF kadar katkıda bulunacağa benziyor.

    3. FOAF
    Popüler bir semantic web uygulaması olan Friend of a Friend, insanlar ya da diğer temsilciler arasındaki ilişkileri açıklar.

    4. Semantic Web Browsers and Interconnection
    Semantic web tarayıcıların uygulamalarından biri BigBlogZoo.com dur. Bu uygulamada 60.000 den fazla xml kaynağı DMOZ schema kullanılarak sınıflandırılabilir ve işlenebilir. Bu programın ticari versiyonu MediaMiner, bu verileri bilgiye dönüştürmek için işler.

    5. Piggy Bank
    Piggy Bank ücretsiz bir Firefox eklentisidir. Piggy Bank web scriptlerini, RDF bilgisine dönüştürüp kulanıcının bilgisayarında depolamaya yarar. Bu bilgi daha sonra, orijinal bağlamdan bağımsız olarak alınıp işlenip, başka bağlamlarda kullanılabilir. Mesela Google Maps ile bu bilgiyi birleştirip bilgi gösterme amaçlı. Piggy Bank Semantic Bank adındaki, yeni web teknolojileri ile verieri etiketleme fikirlerini birleştiren yeni servis ile çalışır. Piggy Bank Simile Project tarafından geliştirilmiştir. Simile Project'in başka bir ürünü ise, belirli veri türlerini, mesela posta koduna karşılık hava tahmini verisi gibi, çevirmeye yarayan RDFizers'dır. Böyle çabalar bugünün webinden semantic varisine geçişteki olası problemleri çözmeyi kolaylaştıracaktır.

    6. Weak AI (Zayıf Yapay Zeka)
    Semantic Web bir çeşit Weak AI'dır. Makinalar tarafından anlaşılabilir doküman kavramı, makinaların insanlar tarafından belirlenmiş kavramları anlayabilen bir yapay zekayı öngörmez.Fakat tam olarak belirlenmiş bir problemin, tam olarak belirlenmiş süreçlerle, var olan ve tam olarak belirlenmiş veriler üzerinde çözebilen bir makina yeteneğini kasteder. Bu bağlamda Semantic Web, büyük ölçekli bir uzman sistem gibi düşünülebilir.
    RDF kolay kullanılabilir olmasına rağmen, paradoxları ve gereksiz söz tekrarlarını ifade edebilecek tam bir dil olacaktır. Her mekanik RDF uygulaması, RDF'i bilinçli olarak kısıtlanmış bir dile çeviren, RDF kullanımını sınırlandıran ve biçimlendiren bir şema kullanacaktır. Bununla beraber, bağlantılar sadece "RDF fiilleri" arasında yapılıyor olsa da, ortaya çıkan ifade büyük miktarda bilgi olacaktır.

    Eleştiriler

    1. Pratik Uygulanabilirlik (Practical Feasibility)
    Bazı eleştiriler, Semantic Web in tam veya kısmi uygulanabilirliğinin, temel imkânlılığını sorgulamaktadır.
    Görünüşte gerçeklenme ihtimalini azaltan bazı yaklaşımlar, konuyu insan davranışı ve kişilik özellikleri perspektifinden eleştirir. (ör: ****crap) Diğer bazı yorumcular yazılım mühendisliğinin son durumundan kaynaklanan kısıtlamalarımızn olduğunu öne sürüyorlar.(bkz: Leaky abstraction)

    2. Sansür ve Mahremiyet
    Semantic Web ile ilgili gayret, sansür ve mahremiyet ile ilgili kaygılarla hafifletilebilir ve yavaşlatılabilir. Mesela, metin analizi yöntemleri, farklı kelimelerle, mecazlarla(****phor) veya yazı yerine resim kullanılarak devre dışı bırakılabilir. Semantic Web, devletler için çevrimiçi içeriğin içerik bloklama programları ile görüntülenmesinin ve yaratımının durdurulmasını oldukça kolaylaştıracaktır. Ek olarak, bu sorun FOAF dosyaları ve Geolocation ****-data kullanımı ile artmıştır. Kişisel blog gibi şeylerle bağlantılı kimlik saklama oldukça kısıtlanacaktır.

    3. Çıktı Biçemlerini İki Katına Çıkarma
    Semantic Web ile ilgili başka bir eleştiri ise, tek parça verinin iki farklı formatta yaratılıp yayınlanmasının daha fazla zaman almasıdır. İnsan algılaması için bir format, makinaların kullanması için özelleştirilmiş ikinci bir format kullanmak gerekecektir. Bu nedenle, firmaların, sadece gelişmelerini yavaşlatma ihtimali olan bu uygulamaları benimsemesi pek olası görünmüyor. Bunun yanında, geliştirilmekte olan birçok web uygulaması bu problemi çözmek için makinalar tarafından okunabilir veriler yayınlıyorlar ve bu tip verileri kullanan istemciler yazıyorlar. Microformat ların geliştirilmesi bu tip eleştiriye bir tepki olarak değerlendirilebilir. Ayrıca RDF verisinin HTML sayfalarına gömülmesini sağlayan eRDF ve RDFa gibi spesifikasyonlar mevcuttur. The GRDDL (Gleaning Resource Descriptions from Dialects of Language (Kaynak Tanımlarını Dil Lehçelerinden Ayıklama)) mekanizması varolan verinin otomatik olarak RDF gibi yorumlanabilmesini sağlar. Böylece yayıncılar sadece HTML gibi tek bir formata ihtiyaç duyarlar.
     

Bu Sayfayı Paylaş