Tweepy, Text Blob ve ArcGIS kullanarak Şehirlerdeki Mekansal Mutluluğa Bir Bakış.

Yapılı çevreyi sosyal medya ile nasıl ölçebiliriz?

Yapılı çevrenin etkilerini anlamak benim için her zaman bir büyü olmuştur. Büyük gelişimi nasıl değerlendiririz? Kent planlamasının hayatı daha iyi hale getirmede başarılı olduğunu nasıl bilebiliriz? Analizimizde veriye dayalı olabilir miyiz?

İnsanların bir yer hakkında ne düşündüklerini öğrenmek için, mimarlar genellikle aylarını topluluk toplantıları düzenleyerek ve ayrıntılı bir anlayış elde etmek için anketler düzenleyerek geçirirler. Ancak çok daha hızlı, daha az kesin bir görüş arıyorsanız, Twitter duyarlılık analizi, insanların herhangi bir yerde herhangi bir zamanda nasıl hissettiğini anlamak için belki de standartlaştırılmış, yüksek hacimli bir yol sağlayabilir. Eh, en azından sosyal medyadaki kendilerinin nasıl hissettiğini.

Düşündüğüm Twitter duyarlılık analizi, bu tweetleri coğrafi olarak yerleştirerek tweetlerin tonu hakkındaki bilgiyle evlenir. Araştırmayı yürütmek için iki farklı şehirde rastgele noktaları örnekledim: Los Angeles ve Chicago. Tweepy API’sini tweet çekmek için, Text Blob’u duyguları analiz etmek için ve ArcGIS’i örnek noktalar arasındaki duyguları değerlendirmek için kullandım.

Analiz.

Tırmanılacak ilk tepe, dünyadaki herhangi bir noktaya yakın tweetlerin duyarlılığını anlamak için basit bir senaryo oluşturmaktı. Girdiğim bir enlem / boylam koordinatı olacaktı ve çıktının o noktanın 1 mil içindeki ortalama tweet duyarlılığı olmasını istedim. Kod aşağıdadır:

Her nokta için, son işlev, belirli bir yarıçap içindeki tweet’leri aramak için Tweepy’yi kullanır. API, belirli bir yarıçap içinde son günden 100’e kadar tweet döndürür. Her tweet, Metin Blobu kullanılarak “Kutupluluk” ve “Öznellik” açısından değerlendirilir. Polarite, -1 ile 1 arasında negatiften pozitife bir kayan nokta olarak döndürülür. Öznellik, 0 ile 1 arasında bir kayan nokta olarak döndürülür. Pandalar kullanılarak, nokta için bir kutupluluk puanı elde etmek için kutupların ortalaması alınır.

Bir nokta hakkındaki duyguları nasıl yakalayacağımızı ve anlayacağımızı öğrendikten sonraki adım, her şehir için örnek noktalar oluşturmaktır. Mekansal twitter duyarlılığını yaklaşık% 95 güven ve% 5 hata payı ile değerlendirmek istedim. Bu, örneğin LA İlçe AOI’m için 294 rastgele örneğe ihtiyacım olduğu anlamına geliyor. Nüfusun az olduğu alanları örneklememek için önce ilçe tarafından sağlanan “LA İlçe Parkları ve Açık Alanlar” veri setinde “Parklar ve Açık Alanlar” olarak belirtilen tüm alanları sildim. Ardından, parksız veri setini kullanarak ArcGIS “Rastgele Noktalar Oluştur” aracıyla rastgele 294 nokta oluşturdum. Bu noktalar, örnek ortalama duyguları elde etmek için daha önce açıklanan senaryoya aktarıldı.

Tüm kentsel alanlar için mekansal Twitter duyarlılığını yorumlamak için, “Ordinary Kriging” aracını kullandım. Kriging, bilinen örnekler arasındaki ortalama Twitter duyarlılığını tahmin etmek için doğrusal denklemler oluşturmak için örnek nokta mesafesi ile duyarlılık değerleri arasındaki ilişkiye bakar. Kriging, tam AOI’ler için iyi tahminler almamızı sağlıyor.

Mekansal Twitter Duyarlılığını İnceleme

Bu analizi LA ve Chicago’da çalıştırdıktan sonra, Twitter duyarlılığının her şehirde nasıl değiştiğini görmek mümkün.

Los Angeles, 28.11.2020

Los Angeles analizimi 28.11.2020 tarihinde çalıştırdım ve sonuçlar yukarıdaki haritada incelenebilir. Harita z-skoru ile sembolize edilmiştir, bu nedenle pozitif ve negatif duyarlılığa sahip olarak görünen alanlar özellikle bu şekildedir. Çoğu alanın ortalamaya yakın olması ve ne özellikle olumlu ne de olumsuz olarak sembolize edilmesi beklenir. Haritaya bakıldığında bazı ilginç desenler var. Malibu bölgesi, LA bölgesinin geri kalanına kıyasla özellikle mutlu. Bu analiz sayesinde, bunun ne olduğunu bilmek zor, ancak güzel kumsallara, doğal parklara yakın yaşamak ve özellikle zengin olmakla bir ilgisi olduğunu tahmin ediyorum. Yine de, bu analize dayanarak, ne kadar zengin olursanız, o kadar mutlu olduğunuzu söylemek zor. Şehrin diğer birçok zengin bölgesi özellikle mutlu değil. Beverly ve Hollywood Hills bölgelerini görün.

Chicago, 28.11.2020

Chicago analizini 28.11.2020 tarihinde de çalıştırdım. Hem LA hem de Chicago için haritalar aynı şekilde ve aynı veri dağıtımında sembolize edilir, böylece doğrudan karşılaştırılabilirler. LA’den farklı olarak Cook County / Chicago bölgesinde özellikle mutlu olan üç bölge vardır. Kuzeyde, geniş Hoffman Estates ve Glenview / Skokie bölgeleri ve güneyde, Illinois-Indiana sınırındaki Calumet City yakınlarında bir alan vardır. Ayrıca, en azından bugün, Cook County’nin güney kesiminin daha yüksek olumsuz duyguları temsil ettiği de açık görünüyor.

Sonuçlar

Bu analizde pek çok yanlışlık olduğunu ilk söyleyen ben olacağım. İlk olarak, bilgilerin yalnızca bir anlık görüntüsünü dikkate alıyorum. Twitter duyarlılığının uzayda nasıl değiştiğini daha doğru anlamak isteseydik, daha uzun bir süre için veri toplamak faydalı olacaktır. Belki bir aylık veri, hatta birkaç yıl. İkincisi, geniş tabanlı Twitter duyarlılığının özellikle bir kişinin mutluluğuyla ilişkili olmadığını ve daha zarif bir sınıflandırma modeli gerektiğini düşünüyorum. Son olarak, Twitter verilerini kullanmakla birlikte gelen çok sayıda kendi kendine seçim var. Sadece bazı insanlar Twitter kullanıyor ve onu çok kullanan kişiler fazla dikkate alınacak. Örneğin. 2016 ile 2020 arasında Washington, DC’de 1600 Pennsylvania Ave. civarında tweetleri örneklediyseniz, bir kişiden çok fazla, yerel nüfusun geri kalanından yeterli olmayan tweet alabilirsiniz.

Kusurlu olsa da, bu analizin Twitter duyarlılık verilerinin potansiyel gücünü gösterdiğini düşünüyorum. Tweetleri kullanarak, zaman ve mekandaki duyguları standart bir şekilde hızlı ve ucuz bir şekilde karşılaştırmak ve karşılaştırmak mümkün hale gelir. Ve bu tür bir analiz, pozitif ve negatif duyarlılığa bakmakla sınırlı değildir. Tweetlerde daha ilginç eğilimleri aramak için daha hedefli modeller yapılabilir. İnsanlar nerede belirli bir şey hakkında konuşuyor? Bazılarının bilgisi ne kadar uzağa seyahat eder? Analiz için gerçekten açık bir kutu.

Sonraki Adımlar

Bunu yayınlamaktaki asıl amacım, yaşadığımız yerleri güçlü ve ölçeklenebilir şekillerde değerlendirmekle ilgili bir sohbet başlatmaktır. Lütfen bu makale hakkında yorum yapmaktan, bana bir e-posta göndermekten veya LinkedIn üzerinden benimle iletişime geçmekten çekinmeyin. Yorumlarınızı ve önerilerinizi duymak isterim!

E-posta: [email protected]

LinkedIn: https://www.linkedin.com/in/benjaminfriedman2/