Treffer: Building An Integrated Database For Turkish Startups: A Systematic And Novel Framework.
Weitere Informationen
In recent years, the Turkish startup ecosystem has grown significantly thanks to the increase in government support, diversification of private investments, the spread of startup culture worldwide, and technological developments. Despite the rapidly increasing numbers, there is no up-to-date, comprehensive, and analytically serviceable database for new entrepreneurial firms in different sectors. This study creates an integrated and centralized database for startups in Türkiye by using a hybrid methodology that combines traditional ETL processes with modern data engineering techniques. All data belonging to the companies were obtained from public databases and national techno-hub pools via the web scrape method and stored in a database on MongoDB, a document-based NoSQL database. While data preprocessing provided consistency, integrity, and structural integrity, exploratory data analysis revealed critical insights into the geographical distribution, fields of activity, and workforce metrics of the startup ecosystem in Türkiye. The findings obtained at the end of the study provide very valuable information to stakeholders, including researchers, policymakers, and firms operating in different sectors. The data pipeline construction methodology introduced in the study, characterized by its scalability and adaptability, also serves as a replicable framework for data engineering projects in other fields. Future research can further enhance its analytical capacity by enriching this dataset with financial metrics and sectoral impacts. [ABSTRACT FROM AUTHOR]
Son yıllarda, Türkiye'deki startup ekosistemi, devlet desteklerinin artması, özel yatırımların çeşitlenmesi, startup kültürünün dünya çapında yayılması ve teknolojik gelişmeler sayesinde önemli ölçüde büyümüştür. Hızla artan sayılara rağmen, farklı sektörlerdeki yeni girişimci firmalar için güncel, kapsamlı ve analitik olarak kullanılabilir bir veri tabanı bulunmamaktadır. Bu çalışma, geleneksel ETL süreçlerini modern veri mühendisliği teknikleriyle birleştiren hibrit bir metodoloji kullanarak Türkiye'deki startup'lar için entegre ve merkezi bir veri tabanı oluşturmaktadır. Şirketlere ait tüm veriler, web kazıma yöntemi ile kamuya açık veri tabanlarından elde edilmiş ve belge tabanlı bir NoSQL veri tabanı olan MongoDB'de bir veri tabanında depolanmıştır. Veri ön işleme tutarlılık, bütünlük ve yapısal bütünlük sağlarken, keşifsel veri analizi Türkiye'deki startup ekosisteminin coğrafi dağılımı, faaliyet alanları ve işgücü metrikleri hakkında kritik içgörüler ortaya koymuştur. Çalışmanın sonunda elde edilen bulgular araştırmacılar, politika yapıcılar ve farklı sektörlerde faaliyet gösteren firmalar dahil olmak üzere paydaşlara çok değerli bilgiler sunmaktadır. Ölçeklenebilirliği ve uyarlanabilirliği ile karakterize edilen çalışmada tanıtılan veri hattı oluşturma metodolojisi, diğer alanlardaki veri mühendisliği projeleri için tekrarlanabilir bir çerçeve görevi de görmektedir. Gelecekteki araştırmalar, bu veri setini finansal ölçümler ve sektörel etkilerle zenginleştirerek analitik kapasitesini daha da artırabilir. [ABSTRACT FROM AUTHOR]
Copyright of Bilecik Seyh Edebali University Journal of Science / Bilecik Şeyh Edebali Üniversitesi Sosyal Bilimler Dergisi is the property of Bilecik Seyh Edebali University Journal of Science and its content may not be copied or emailed to multiple sites without the copyright holder's express written permission. Additionally, content may not be used with any artificial intelligence tools or machine learning technologies. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)