Apache Superset, interaktif veri analizi ve görselleştirmesi yapabilen açık kaynaklı bir veri keşif ve görselleştirme aracıdır. Superset, büyük veri setleri üzerinde çalışabilme yeteneği, kullanıcı dostu arayüzü ve geniş veri kaynağı desteği ile bilinir.
1. Gereksinimler ve Kurulum
Superset’in çalışabilmesi için öncelikle gerekli bağımlılıkları yüklemeniz gerekiyor. Bu, Python ve birkaç harici kütüphaneyi içerir. Aşağıdaki komutları terminal veya komut istemcisine yazarak yapabilirsiniz:
Ubuntu 20.04 için kurulum;
Öncelikle Superset için gereksinimleri kurmamız gerekiyor.
sudo apt-get install build-essential libssl-dev libffi-dev python3-dev python3-pip libsasl2-dev libldap2-dev
Bu kodun hemen devamında sanallaştırma yapmamız gerekiyor.
pip install virtualenv
Şimdi sırayla aşağıdaki komutları çalıştırın.
python3 -m venv venv
. venv/bin/activate
Şimdi Superset kurulumu için gereksinimlerimiz tamam.
Superset kurulumu için;
pip install apache-superset
Hemen peşinden veritabanını yükseltelim.
superset db upgrade
Şimdi son adımlar aşağıdaki komutları sırayla çalıştıralım.
export FLASK_APP=superset
superset fab create-admin
superset load_examples
superset init
superset run -p 8088 --with-threads --reload --debugger
Kurulumumuz başarıyla tamamlanmıştır. IPAdres:8088 veya domain:8088 ile erişebilirsiniz.
Adım 2: Veri Kaynağı Bağlantısı
Superset, birçok farklı veri kaynağına bağlanma yeteneği sunar. Veritabanları, çeşitli veri depolama sistemleri ve hatta Big Data çözümleri ile entegrasyon mümkündür. Superset kullanıcı arayüzü üzerinden veri kaynağı ekleyebilir ve bağlantı ayarlarını yapılandırabilirsiniz. Superset’i kullanarak aşağıdaki veri kaynaklarını entegre edebilirsiniz.
- Relational Veritabanları:
- PostgreSQL
- MySQL
- SQLite
- Microsoft SQL Server
- Oracle
- NoSQL Veritabanları:
- Apache Cassandra
- MongoDB
- Apache Druid
- Big Data Çözümleri:
- Apache Hive
- Apache Spark
- Google BigQuery
- Presto
- WMS (Web Map Service) ile Harita Verileri:
- Mapbox
- Google Maps
- CSV, Excel ve Diğer Dosya Formatları:
- Superset, CSV, Excel ve diğer yaygın dosya formatlarından veri okuyabilir.
- Apache Druid:
- Apache Superset, özellikle Apache Druid ile uyumlu çalışır. Druid, büyük ölçekli veri setlerini sorgulamak ve görselleştirmek için kullanılan bir sorgu motoru ve zaman serisi veritabanıdır.
- Kendi Veri Kaynakları:
- Ayrıca, Superset kullanıcıları, SQLAlchemy URI formatında kendi veri kaynaklarını tanımlayabilirler. Bu, özel API’ler, hizmetler veya özel veri tabanlarına bağlanma olanağı sağlar.
Bu sadece Superset’in desteklediği bazı önemli veri kaynaklarıdır. Superset, geniş bir veri kaynağı yelpazesiyle uyumlu çalışabilme yeteneği sayesinde kullanıcıların farklı veri depolama sistemleriyle etkileşimde bulunmasına olanak tanır. Yine de, Superset’in belirli bir sürümü ve yapılandırması ile ilgili olarak resmi dokümantasyonu kontrol etmek her zaman en güncel ve doğru bilgileri sağlar.
Adım 3: SQL Sorguları ve Veri Keşfi
Veri kaynağına bağlandıktan sonra, Superset kullanıcıları SQL sorgularını kullanarak veya görsel sorgu arayüzü ile veriyi sorgulayabilirler. Bu adım, veri setlerini anlamak ve gerekli ön işleme adımlarını gerçekleştirmek için önemlidir.
- Veri Kaynağı Seçimi: Superset kullanıcı arayüzü üzerinden, sorgulama yapmak istediğiniz veri kaynağını seçin. Bu, önceden bağlantı kurulmuş bir veritabanı veya başka bir veri kaynağı olabilir.
- SQL Lab’e Giriş: Superset’in SQL Lab özelliği, kullanıcılara interaktif bir SQL sorgu arayüzü sağlar. SQL Lab’e giderek yeni bir sorgu başlatın.
- SQL Sorgusu Yazma: SQL Lab arayüzünde, SQL sorgularınızı yazabilir ve çalıştırabilirsiniz. Superset, SQL dilini destekleyerek kullanıcılara geniş bir esneklik sunar.
- Sonuçları Görselleştirme: SQL sorgularının sonuçlarını çeşitli grafikler ve tablolar şeklinde görselleştirebilirsiniz. Bu, verileri daha anlamlı hale getirmenize yardımcı olur.
- Sonuçları Kaydetme ve Paylaşma: Oluşturulan görselleştirmeleri kaydedebilir ve isterseniz paylaşabilirsiniz. Ayrıca, interaktif panolar oluşturarak farklı görselleştirmeleri bir araya getirebilirsiniz.
Adım 4: Görselleştirmeler
Superset’in sunduğu çeşitli görselleştirme seçenekleri ile veriyi anlamlı hale getirebilirsiniz. Grafikler, haritalar, gösterge panoları ve daha fazlası, kullanıcıların verileri anlama ve paylaşma süreçlerini kolaylaştırır.
Adım 5: Dashboard Oluşturma
Oluşturulan görselleştirmeleri birleştirerek interaktif panolar oluşturmak, Superset’in en güçlü özelliklerinden biridir. Panolar, kullanıcıların farklı görselleştirmeler arasında etkileşimde bulunmalarını sağlar.
1. Panoyu Oluşturma:
Superset kullanıcı arayüzü üzerinden bir pano oluşturmak oldukça basittir. Ana sayfadan “Dashboards” sekmesine gidin ve “Create” butonuna tıklayarak yeni bir pano başlatın. Ardından, bu panoya isim verin ve gerekirse açıklama ekleyin.
2. Görselleştirmeleri Ekleyin:
Oluşturulan panoya görselleştirmeler eklemek için, panonuzun düzenleme moduna geçin ve panoya eklemek istediğiniz grafikleri, haritaları veya tabloları seçin. Superset’in sunduğu kullanıcı dostu arayüzle, bu adım oldukça sezgiseldir.
3. Panoyu Özelleştirme:
Panoyu daha anlamlı ve etkili hale getirmek için çeşitli özelleştirme seçeneklerini kullanabilirsiniz. Renk düzenini, başlıkları, etiketleri ve diğer görsel öğeleri düzenleyerek panonuzu kişiselleştirebilirsiniz.
4. Publish (Yayınlama) İşlemi:
Panoyu oluşturduktan ve özelleştirdikten sonra, “Publish” veya “Save” gibi bir düğme üzerinden panoyu yayınlayın. Bu işlem, pano içeriğini yayına alır ve diğer kullanıcıların erişimine açar.
5. Yetkilendirme (Authorization):
Panoyu paylaşmadan önce, kullanıcıların bu panoya erişim yetkilerini düzenlemeniz gerekebilir. Superset, kullanıcılara ve gruplara özgü yetkilendirme seçenekleri sunar. “Security” veya “Access” bölümlerinden, panoya kimlerin erişim sağlayabileceğini belirleyebilirsiniz.
6. Panoyu Paylaşma:
Panoyu oluşturduktan, yayınladıktan ve yetkilendirdikten sonra, paylaşma seçeneklerini kullanarak panoyu diğer kullanıcılarla paylaşabilirsiniz. Panonuzun URL’sini veya gömme kodunu alarak, bu panoyu web sayfalarında paylaşabilirsiniz.
Adım 6: Güvenlik ve Erişim Kontrolü
Superset, veri güvenliğine önem verir. Kullanıcılar ve gruplar arasında erişim kontrolü sağlamak, hassas verilere yetkisiz erişimi önler. Güvenlik ayarlarını yapılandırmak, Superset’i güvenli bir şekilde kullanmanıza yardımcı olur.
Kullanıcı ve Grup Yönetimi:
Superset üzerinde kullanıcıları ve grupları yönetmek, güvenlik ve erişim kontrolü açısından kritiktir. Yönetim paneli üzerinden kullanıcıları ekleyebilir, gruplar oluşturabilir ve bu kullanıcıları gruplara atayarak düzenleyebilirsiniz.
- Kullanıcı Ekleme:
- Superset ana sayfasında, sağ üst köşede bulunan kullanıcı adınıza tıklayarak “Profile” sayfasına gidin.
- “Security” sekmesine geçerek, “List Users” bölümünden “Add User” seçeneğini kullanarak yeni kullanıcılar ekleyin.
- Grup Oluşturma:
- Yine “Security” sekmesinden “List Groups” bölümünden “Add Group” seçeneği ile yeni gruplar oluşturun.
- Kullanıcıları Gruplara Atama:
- Kullanıcıları gruplara atayarak, grup bazlı yetkilendirmeleri yönetebilirsiniz.
2. Roller ve İzinler:
Superset, kullanıcılara farklı roller ve izinler atama imkanı sunar. Bu, kullanıcıların belirli eylemleri gerçekleştirebilmesini kontrol etmek için önemlidir.
- Rol Tanımlama:
- Kullanıcı ve gruplar için roller belirleyin. Örneğin, “Viewer” rolü sadece panoları görüntülemeye yetkilidir, “Editor” rolü ise panoları düzenleme yetkisine sahiptir.
- İzinleri Yönetme:
- Rollere özel izinleri yönetmek için “Security” sekmesindeki “Roles List” bölümünden ilgili role tıklayarak izinleri ayarlayabilirsiniz.
3. Panolar ve Veri Kaynakları İçin Erişim Kontrolü:
Panoları ve veri kaynaklarını kullanıcılar arasında paylaşırken, bu içeriklere erişim kontrolü sağlamak önemlidir.
- Panoların Yetkilendirmesi:
- Pano oluştururken veya düzenlerken, “Security” veya “Access” bölümlerinden panoya kimlerin erişebileceğini belirleyebilirsiniz.
- Veri Kaynakları İçin Yetkilendirme:
- Veri kaynağına bağlanırken, bu kaynağa kimlerin erişebileceğini ve hangi izinlere sahip olacağını belirleyebilirsiniz.
4. SSL/TLS Kullanımı:
Superset’i kullanırken, güvenlik için SSL/TLS sertifikalarını kullanmak önerilir. Bu, veri iletimi sırasında şifreleme sağlar ve güvenli bir bağlantı kurulmasına yardımcı olur.
- SSL/TLS Yapılandırması:
- Superset’in web sunucusunu yapılandırarak, HTTPS üzerinden erişimi sağlayabilirsiniz.
Adım 7: Topluluk ve Güncel Dokümantasyon
Superset’in geniş bir topluluğa sahip olması, sorularınızı sormak ve yeni özellikler hakkında bilgi edinmek için harika bir kaynaktır. Ayrıca, güncel dokümantasyonu takip ederek yeni özellikleri ve değişiklikleri öğrenebilirsiniz.