Ölçümlerle Model Doğrulama

Mevcut Modellerle Karşılaştırma
Alıntı dinamikleri modellerinin bir araştırmasını yapıyoruz ve tercihli bağlanma ve uyum modellerine odaklanıyoruz. Belirli gerçekçi koşullar altında bu modellerin eşdeğer olduğunu gösteriyoruz. Tercihli bağlanma mekanizmasının mikroskobik temellerini bulmak için, teorik ve deneysel olarak birkaç alıntı ağını analiz ediyoruz ve geniş bir uygunluk dağılımı için bu mekanizmanın uygunluk modeline indirgendiğini gösteriyoruz.
Uygunluk modeli, ampirik tercihli bağlanma modeli çerçevesinde açıklanamayan zor bir parametre olan ilk çekicilik K0 için uzun süredir aranan açıklamayı verir.
İlk çekiciliğin uygunluk dağılımının genişliği tarafından belirlendiğini gösteriyoruz. Tercihli bağlanma ve uygunluk modellerini yinelemeli aramaya dayalı mikroskobik alıntı dinamikleri modelimiz ile karşılaştırıyoruz ve modelimizin bu fenomenolojik modellerin her ikisini de içerdiğini gösteriyoruz.
Teorik Model
Bilimsel makalelerin alıntılarının kuvvet yasası dağılımını açıklamak için de Solla Price kümülatif avantaj modelini önerdi. Bu model, sabit N oranıyla görünen kağıtlardan oluşan bir ağ varsayar, her kağıt eskilere ∼ R0 referans verir. Yeni bir i makalesinin eski bir makaleden alıntı yapma olasılığı j’dir.
Burada Kj, j makalesinin atıf sayısıdır. İlk çekicilik K0, yeni makalelerin de alıntılanmasını sağlar (de Solla Fiyatı K0 c ile gösterilir). Denklem tarafından yakalanan kümülatif avantaj mekanizması. 9.1, üs ile bir kuvvet kanunu alıntı dağılımı, p(K) ∼ K−ν verir.
Herhangi bir ipucu yokluğunda, Fiyat K0 = 1 olarak varsayılmıştır. R0 >> 1 olduğundan, ν 2’yi biraz aşar. 1990’larda sayısallaştırılmış bilginin çoğalmasını takiben, bir dizi bilgi, biyolojik ve sosyal karmaşık ağ ön plana çıktı. bilimsel araştırmaların çoğu, ν ∼ 3 ile kuvvet yasası derecesi dağılımları sergiliyor.
Bu dağılımları hesaba katmak için Barabasi ve Albert, Price’ın kümülatif avantajına çok benzeyen ancak onunla aynı olmayan tercihli bağlanma modelini önerdiler. Atıf ağı ile ilgili olarak, Barabasi-Albert modeli, yeni bir makalenin eski bir makaleden j olasılıkla alıntı yaptığını varsayar.
Aşağıda, Price’ın ve Barabasi-Albert yaklaşımları arasında bir ayrım yapmayacağız ve tercihli bağlanma modeli olarak belirtilmemiş K0 ile ele alacağız. Karmaşık ağlardaki görünüşte evrensel güç yasası derece dağılımını açıklamadaki başarısı, doğrusal olmayan bağlanma kuralı ve yaşlanma da dahil olmak üzere bir dizi teorik genellemeyi harekete geçirdi. Genelleştirilmiş tercihli bağlanma modeli, aşağıdaki denklemle yakalanır.
Burada t = ti − tj j kağıdının i kağıdına göre yaşıdır, ζ ek üssüdür ve A(t) modelde görünenden farklı yaşlanma fonksiyonudur.
Çapraz doğrulama
Model doğrulama Yöntemleri
Cross Validation Nedir
K katlı Çapraz doğrulama
Validation set nedir
Cross validation
Çapraz doğrulama Nedir
Model değerlendirme Yöntemleri
Ölçümlerle Model Doğrulama
Tercihli bağlanma modelinin doğrudan doğrulanması, makalelerin yazarları tarafından verilen kararların analizini gerektirir ve bildiğimiz kadarıyla bu yaklaşım şu ana kadar uygulanmamıştır. Ortak yaklaşım, bireysel makalelerin alıntı dinamiklerini izlemektir. Bu amaçla, perspektif alıntı yapan makaleden alıntı yapılan makaleye kaydırılır ve bu aşağıdaki denklemle sonuçlanır.
N, yıllık yayın sayısıdır. [Not l A(tl)[Kl+K0]ζ 0 A(t) ve A ̃(t) arasındaki fark: Barabasi-Albert modeli için A(t) = 1 iken A ̃(t) = 2N . Hem A(t) hem de A ̃(t) modelde görünen yaşlanma fonksiyonlarından farklıdır.
Ölçümler, atıf ağlarının büyümesinin gerçekten de Denklem 9.5’i takip ettiğini doğruladı, ancak bu ölçümlerden bazıları yalnızca düşük ve orta Kj’ye sahip makaleler için tercihli bağlanma (ΔKj, Kj ile büyür) sergilerken, yüksek oranda atıf yapılan makaleler sıklıkla anti-tercihli bağlanma sergiliyor ( ΔKj, Kj ile azalır).
Doğrusallıkla ilgili olarak, ilk ölçümler doğrusal veya doğrusala yakın (ζ ≈ 1) tercihli bağlanma iddiasında bulunurken, bilimsel makalelerin ve patent alıntılarının büyük veri kümeleri için sonraki ölçümler, ζ ∼ 1.25 üssü ile süper doğrusal bağlanmayı ortaya çıkardı.
İlk çekiciliğin ölçümleri, tercihli bağlanma modeli için önemli bir zorluk teşkil ediyordu. Aslında, bilimsel makalelere yapılan atıflar için ilk çekicilik çok küçük K0 ∼ 1’dir. Patent alıntıları da küçük K0 ∼ 1 verir.
Böylesine küçük bir başlangıç çekiciliği, Barabasi-Albert varsayımı K0 = R0’dansa, Price’ın K0 = 1 varsayımına daha iyi uyar. Bununla birlikte, K0 ∼ 1, gözlemlerle bağdaşmayan, kuvvet yasası alıntı dağılımının çok küçük bir üssünü verir.
Tercihli bağlanma modelinin bazı spesifik tahminleri de gözlemlerle çelişmektedir. Özellikle, bu model ilk harekete geçiren avantajı, yani makalenin yaşı ile aldığı alıntıların sayısı arasındaki güçlü pozitif korelasyonu tahmin eder. Bununla birlikte, ölçümler bu tür bir korelasyonu yalnızca zayıf olarak da ortaya koymaktadır.
Model, makalelerin atıf dinamiklerinin zamanla yavaşladığını ve aynı yıl yayınlanan makalelerin atıf yörüngelerinin çok benzer olması gerektiğini de öngörmektedir.
Bununla birlikte, ölçümler, bu yörüngelerin güçlü bir şekilde farklılaştığını ve zamanla mutlaka yavaşlamadığını göstermektedir. Özellikle, atıf yörüngeleri zamanla hızlanan gazeteler olan uyuyan güzeller de vardır.
Ayrıca tercihli bağlanma modeli, bir yıl içinde yayınlanan makaleler için atıf dağılımlarının dar ve üslüye yakın olması gerektiğini öngörürken, ölçümler bu dağılımların geniş ve kuvvet yasasına veya log-normale yakın olduğunu da göstermektedir.
Son olarak, tercihli bağlanma modeli, büyüyen karmaşık ağın beğenilebilirliğinin K0 başlangıç çekiciliği tarafından belirlendiğini gösterir; öyle ki, küçük ve pozitif ilk çekicilik için (birçok ağda ölçüldüğü gibi) ağın disassortatif olması gerekir. Bu, alıntı ağlarının zayıf bir şekilde tasnif edici olduğunu ortaya koyan ölçümlere de uymuyor.
Tercihli Bağlanma
Gerçek büyüyen karmaşık ağların niceliksel hesabı için tercihli bağlanma modeli uygulandığında, çok fazla zorlukla karşılaşır. En popüler çözüm, bir düğümün kenarları çekme eğilimini (bir makalenin alıntılar çizme yeteneği) karakterize eden bir özellik olan uygunluğu tanıtmaktır. Uygunluk, düğüm alaka düzeyi, yerel kümeleme katsayısı, düğüm sıralaması ve PageRank katsayısı ile ilişkilendirmek için birkaç girişimde bulunulmasına rağmen, ölçümlerden bulunması gereken ampirik bir niteliktir.
Çapraz doğrulama Çapraz doğrulama Nedir Cross validation Cross Validation Nedir K katlı Çapraz doğrulama Model değerlendirme Yöntemleri Model doğrulama Yöntemleri Validation set nedir
Son yorumlar