مهندسی داده با پایتون و Django – راهنمای کاربردی


در این مطلب، با مبحث مهندسی داده آشنا خواهید شد. بدون شک، «مهندسی داده» (Data Engineer) یکی از سختترین جنبههای «علم داده» (Data Science) محسوب میشود. اگرچه مهندسی داده نقش زیادی در بخش «تحلیل داده» (Data Analysis) در حوزه علم داده ندارد، با این حال، به عنوان Back-End سیستمهای تحلیل داده و علم داده محسوب میشود. منظور از Back-End در تعریف مهندسی داده به عنوان بخشی از علم داده، «سیستمهای پایگاه دادهای» (Database Systems) است که تمامی «دانشمندان علم داده» (Data Scientists) به نحوی با آن سر و کار دارند.
در این مطلب، برای روشنتر شدن مفهوم مهندسی داده برای خوانندگان و مخاطبان، مباحث زیر مورد بررسی قرار میگیرند:
- تولید یک برنامه کاربردی مبتنی بر Django با «سیستمهای مدیریت پایگاه داده رابطهای» (Relational Database Management System | RDBMS).
- نمایش چگونگی استفاده از پایگاه داده PostgresSQL متصل به برنامه کاربردی مبتنی بر Django.
- چگونگی جابجا کردن دادهها میان «قالبها» (Formats) و «پلتفرمهای» (Platforms) مختلف.
با اینکه برای درک مفاهیم موجود در این مطلب نیازی به دانش اولیه در مورد پلتفرم Django وجود ندارد، با این حال ذکر این نکته حائز اهمیت است که بسیاری از اقدامات مرتبط با جمعآوری دادهها، از طریق بسترها یا برنامههای کاربردی مبتنی بر وب انجام میگیرد. در نتیجه، آشنایی با پلتفرمی نظیر Django، فرایند جمعآوری و مدیریت دادهها در برنامههای کاربردی تحت وب را به مراتب سادهتر میکند.
پلتفرم Django برای بسیاری از دانشمندان داده که با مبحث مهندسی داده سر و کار دارند، ابزاری بسیار محبوب و آشنا محسوب میشود. پلتفرم Django، چارچوبی برای ساختن «برنامههای کاربردی تحت وب» (Web Applications) فراهم میآورد که از فلسفه «وارونگی کنترل» (Inversion of Control) در «مهندسی نرمافزار» (Software Engineering) تبعیت میکند.
وارونگی کنترل، یک اصل در مهندسی نرمافزار است که «جریان کنترل» (Flow of Control) را در برنامههای کاربردی، در مقایسه با کنترل جریان مرسوم، معکوس میکند. به عبارت دیگر، پلتفرم Django اسکلت (Skeleton) برنامه کاربردی تحت وب را فراهم میکند و کاربر یا برنامهنویس وظیفه دارد محتویات اصلی و لازم برای عملکرد صحیح برنامه کاربردی تحت وب را فراهم آورد. به بیان سادهتر، پلتفرم Django امکانات زیرساختی، نرمافزاری و برنامهنویسی لازم برای مهندسی داده در برنامه کاربردی تحت وب را فراهم میآورد.
مهندسی داده در Django
برای اینکه مکانیزم مهندسی داده توسط Django در پایتون آموزش داده شود، نحوه کدنویسی برنامهای به نام DoubleBagger نمایش داده خواهد شد. این برنامه کاربردی، یک «وبلاگ» (Blog) ویژه مسائل سرمایهگذاری است که مردم، نظر خود را در مورد خرید یا فروش سهام شرکتهای عرضه شده در بازار بورس نظیر اپل (APPLE | AAPL) یا مایکروسافت (MICROSOFT | MSFT) با دیگر افراد به اشتراک میگذارند.
همچنین، در این مطلب به جای استفاده از «محیطهای توسعه یکپارچه» (Integrated Development Environments | IDEs) نظیر PyCharm و Jupyter Notebook، از یک واسط خط دستور (Command Line Interface) و یک «ویرایشگر منبع کد» (Source Code Editor) به نام Sublime Text استفاده میشود.
علاوه بر این، از آنجایی که برنامه کاربردی مرتبط با علم داده است، از محیط Conda برای نصب کتابخانهها و بستههای نرمافزاری و همچنین، ایجاد «محیطهای مجازی» (Virtual Environment) استفاده میشود.
1# I like to do things on my desktop
2# From the terminal:
3$ cd desktop && mkdir doublebagger && cd doublebagger
4$ conda create -n doublebagger
5$ conda activate doublebagger
6# You should now have the (doublebagger) conda environment activated
برای ساختن برنامه کاربردی مورد نظر، نیاز است تا دو کتابخانههای مهم زبان پایتون توسط Conda نصب شوند؛ کتابخانه Django و کتابخانه psycopg2 برای متصل شدن به پایگاههای داده PostgreSQL. استفاده از SQLite برای بسیاری از نیازهای سازمانی شرکتها و یا کسانی که به شکل سرگرمی برنامهنویسی انجام میدهند، مناسب است. با این حال، در این برنامه کاربردی، برای استفاده از قابلیت پایگاه داده از پایگاههای داده PostgreSQL استفاده میشود. علاوه براین، برای پیادهسازی برنامه کاربردی و توسعه پروژه مهندسی داده، از نسخه 1.9.6 کتابخانه Django استفاده میشود.
1$ (doublebagger) conda install Django==1.9.6 psycopg2
پس از اطمینان از این موضوع که علاوه بر کتابخانههای برنامهنویسی، «وابستگیهای» (Dependencies) آنها نیز به درستی روی سیستم نصب شدهاند، یک دایرکتوری به نام src ایجاد میشود تا تمامی کدهای منبع و کدهای جانبی مرتبط با برنامه Doublebagger در این دایرکتوری ذخیره شوند.
1$ (doublebagger) mkdir src && cd src
در مرحله بعد، از قطعه کدهای زیر برای ایجاد یک پروژه Django و شروع کد نویسی برنامه کاربردی Doublebagger استفاده میشود:
1# Inside of src:
2# don't forget the space and period at the end
3$ (doublebagger) django-admin startproject doublebagger_blog .
دستور django-admin startproject command همان دستوری است که به وسیله آن، اسکلت یا چارچوب لازم برای برنامه کاربردی تحت وب فراهم میشود. با دقت به ساختار پوشهبندی برنامه کاربری ایجاد شده، پوشه src ساختاری مشابه با شکل زیر خواهد داشت:
- پوشه doublebagger_blog: تنظیمات مرتبط با پروژه از جمله فایل settings.py، در این پوشه قرار دارد.
- پوشه manage.py: در این پوشه، فایلهای مرتبط با utility function پروژه ذخیره میشود.
پس از انجام مراحل فوق، کاربر یا برنامهنویس قادر خواهد بود تا پروژه مهندسی داده ایجاد شده با نام DoubleBagger را درون Sublime Text یا هر ویرایشگر کد دیگری باز کند. ساختار دایرکتوری ایجاد شده برای پروژه DoubleBagger، باید به شکل زیر باشد:
با فرض اینکه، نرمافزار مدیریت پایگاه داده PostgreSQL روی سیستم کاربر یا برنامهنویس نصب شده باشد، در مرحله بعد لازم است تا یک پایگاه داده PostgreSQL برای پروژه مهندسی داده (DoubleBagger) ایجاد شود:
1# from the command line:
2$ psql -d postgres
3postgres=# CREATE DATABASE doublebagger;
4# That's it!
5# quit by:
6postgres=# \q
در ادامه نیاز است تا فایل settings.py توسط کاربر یا برنامهنویس در نرمافزار ویرایشگر کد Sublime Text باز شود. پس از باز کردن فایل، محتویات آن به شکل زیر خواهد بود:
1# settings.py
2DATABASES = {
3 'default': {
4 'ENGINE': 'django.db.backends.sqlite3',
5 'NAME': os.path.join(BASE_DIR, 'db.sqlite3'),
6 }
7}
برای اینکه بتوان پروژه مهندسی داده ایجاد شده را به پایگاه داده تولید شده متصل کرد، لازم است تا محتویات پیشفرض موجود در فایل settings.py را با محتویات زیر تغییر داد و تغییرات انجام شده را نیز در ویرایشگر کد ذخیره کرد:
1# Your 'User' is probably different depending on how you set up
2# postgres. In many cases, it's just 'postgres'.
3# Also depends if you set up a password with you postgres.
4DATABASES = {
5 'default': {
6 'ENGINE': 'django.db.backends.postgresql_psycopg2',
7 'NAME': 'doublebagger',
8 'USER': 'WhoeverOwnsTheDatabase',
9 'PASSWORD': '',
10 'HOST': '127.0.0.1',
11 'PORT': '5432',
12 }
13}
در مرحله بعد، برای متصل کردن پروژه مهندسی داده و برنامه کاربردی تحت وب به پایگاه داده PostgreSQL، لازم است تا قطعه کدهای زیر در واسط خط دستوری اجرا شوند:
1# Still inside of your src where manage.py lives:
2$ (doublebagger) python manage.py migrate
اگر اجرای تمامی کدهای نمایش داده شده در مراحل بالا با موفقیت انجام شود، پیغامهایی مانند شکل زیر در خروجی نمایش داده خواهد شد:
سپس، در همان واسط خط دستوری، دستور زیر اجرا میشود:
1$ (doublebagger) python manage.py runserver
با اجرای دستور بالا، آدرس یک «سرور محلی» (Local Server)، همانند آدرس زیر، نمایش داده خواهد شد:
1127.0.0.1:8000
با باز کردن آدرس سرور محلی نمایش داده شده در «مرورگر وب» (Browser)، کاربر یا برنامهنویس، با پیغامی همانند پیغام زیر روبرو خواهد شد:
صفحهای که در نتیجه باز کردن آدرس سرور محلی باز خواهد شد، در اصل «صفحه نخست» (Homepage) برنامه کاربردی تحت وب است. این صفحه در «سرورهای توسعه محلی» (Local Development Server) کتابخانه Django اجرا میشود و هدف آن، همانند سازی اجرای برنامه کاربردی تولید شده در «وب سرور» (Web Server) واقعی است. برای خارج شدن از حالت سرورهای توسعه محلی Django، از فشار دادن همزمان کلیدهای control-C استفاده میشود.
مهندسی داده در برنامههای کاربردی تحت وب
دلیل استفاده از Django و پایگاه داده PostgreSQL در پروژههای مهندسی داده این است که مدلهای Django، قابلیتی تحت عنوان «نگاشت کننده مدل اشیاء به مدل رابطهای» (Object Relational Mapper | ORM) در اختیار برنامهنویسان و توسعه دهندگان برنامههای کاربردی تحت وب قرار میدهد. این قابلیت به برنامهنویسان و توسعهدهنگان اجازه میدهد تا «اشیاء» (Objects) مدل را با استفاده از زبان پایتون و زمانی که برنامه کاربردی تحت وب به پایگاه داده PostgreSQL متصل است، دستکاری کنند.
ویژگی ORM، یکی از لایههای پیچیده پایتون و Django در تعریف و مدیریت «اکوسیستمهای علم داده» (Data Science Ecosystems) محسوب میشود. از این مرحله به بعد، ساختار دادهها در برنامه کاربردی تحت وب و پروژه مهندسی داده در حال توسعه تعریف میشوند. برنامه کاربردی تحت وب در حال توسعه، دو «مؤلفه» (Component) یا «کلاس مدل» (Model Class) خواهد داشت:
- مؤلفه Post: نمایش دهنده پستهایی از وبلاگ است که در رابطه با خرید یا فروش سهام یک شرکت خاص بحث میکنند.
- مؤلفه Company: نمایش دهنده اطلاعات مرتبط با شرکتهایی است که در پستهای وبلاگ از آنها نام برده میشود.
مؤلفه Post، اطلاعات زیر را شامل خواهد شد:
- عنصر title: عنوان پست منتشر شده در وبلاگ.
- شناسه slug: شناسه یکتا برای هر کدام از پستهای وبلاگ، که بر اساس عنوان پستها ساخته میشود.
- عنصر text: متن واقعی پستهای وبلاگ.
- عنصر pub_date: زمان انتشار پستهای وبلاگ را نشان میدهد.
مؤلفه Company نیز، اطلاعات زیر را شامل خواهد شد:
- عنصر name: نام شرکتی که پستهای وبلاگ، اطلاعات خاصی در مورد سهام آنها منتشر میکند.
- عنصر slug: شناسه یکتا برای شرکت.
- عنصر description: اطلاعات مرتبط با حیطه وظایف شرکت را نمایش میدهد.
- عنصر PE Ratio: ارزشگذاری شرکتها نسبت به قیمت بازار را نشان میدهد.
پیش از اینکه بتوان کدهای لازم برای پیادهسازی مؤلفههای Post و Company و عناصر موجود در هر کدام از این مدلهای Django را نمایش داد، لازم است تا ابتدا یک برنامه کاربردی تحت وب Django، با استفاده از دستورات زیر تولید شود:
1# We're going to call our app 'post'
2# Inside of src from terminal:
3$ (doublebagger) python manage.py startapp post
پس از اجرای دستورات فوق، پوشه مرتبط با یک برنامه کاربردی به نام post، مانند شکل زیر، در وایشگر کد قابل مشاهده خواهد بود:
در مرحله بعد لازم است تا برنامه post به قسمت INSTALLED_APPS در فایل settings.py الحاق و تغییرات انجام شده ذخیره شود:
1# settings.py
2INSTALLED_APPS = [
3 'django.contrib.admin',
4 'django.contrib.auth',
5 'django.contrib.contenttypes',
6 'django.contrib.sessions',
7 'django.contrib.messages',
8 'django.contrib.staticfiles',
9 'post',
10]
11# Don't forget to save changes
پس از انجام مراحل فوق، وقت آن فرا میرسد تا ساختار دادهها، از طریق اضافه کردن قطعه کدهای زیر به فایل models.py در پوشه post مشخص شود:
1# post/models.py
2from __future__ import unicode_literals
3from django.db import models
4# Create your models here.
5class Post(models.Model):
6 title = models.CharField(max_length=100)
7 slug = models.SlugField()
8 text = modelsle.TextField()
9 pub_date = models.DateField()
10class Company(models.Model):
11 name = models.CharField(max_length=100)
12 slug = models.SlugField()
13 description = models.TextField()
14 pe_ratio = models.DecimalField(max_digits=7, decimal_places=2)
یکی از مهمترین جنبههای مدلهای تولید شده که باید مد نظر قرار داده شود این است که دو مدل (مؤلفه) تولید شده چگونه با یکدیگر ارتباط دارند. اگر با دید SQL به کدهای بالا و مؤلفههای تولید شده توسط آنها نگاه شود، مشخص میشود که مؤلفههای Post و Company، ساختار «جدولی» (Tabular) دارند و «فیلدهایی» (Fields) نظیر title ،pub_date و slug، «ستونهای» (Columns) موجود در دو جدول را نمایش میدهند.
بنابراین، اگر با دید SQL به دو مدل یا مؤلفه تولید شده نگاه شود، لازم است تا رابطه میان آنها نیز مشخص شود:
- رابطه «یک به چند» (One-to-Many) یا «چند به یک» (Many-to-One)
- رابطه «چند به چند» (Many-to-Many)
با در نظر گرفتن جمله زیر، به راحتی مشخص میشود که رابطه چند به یک میان مدلهای (مؤلفههای) Post و Company وجود دارد.
One blog post can only be an investment thesis about one company, but one company can have many blog posts written about it.
در نتیجه، برای مدلسازی ساختار دادهها توسط پایگاههای داده رابطهای نیاز است تا مدل Post، یک «کلید خارجی» (Foreign Key) به مدل Company داشته باشد. ویژگی مهم کتابخانه Django، سادگی استفاده از آن است. کتابخانه Django، غالب عملیات لازم جهت ساختن یک مدل پایگاه داده را مدیریت میکند؛ لازم نیست تا «کلیدهای اصلی» (Primary Keys) به طور صریح تعریف شوند و نیازی به تعریف «شاخصها» (Indexes) یا «جداول اتصالی» (Junction Tables) در روابط چند به چندی وجود ندارد.
با استفاده از پلتفرم Django، کلید خارجی به شکل زیر به مدل Post اضافه میشود:
1# post/models.py
2class Post(models.Model):
3 title = models.CharField(max_length=100)
4 slug = models.SlugField()
5 text = modelsle.TextField()
6 pub_date = models.DateField()
7 company = models.ForeignKey('Company') # Here
اضافه کردن برخی پارامترهای اضافی و «توابع رشتهای» (String Methods)، به سیستم اجازه میدهد تا به «اشیاء مدل» (Model Objects) توسط نام رشتهای آنها ارجاع دهد. بنابراین، مدل Post بهروزرسانی شده و نهایی، در پروژه مهندسی داده در حال توسعه، به شکل زیر خواهد بود:
1# post/models.py
2from __future__ import unicode_literals
3from django.db import models
4# Create your models here.
5class Post(models.Model):
6 title = models.CharField(max_length=100)
7 slug = models.SlugField(max_length=50, unique_for_month='pub_date')
8 text = models.TextField()
9 pub_date = models.DateField('date_published', auto_now_add=True)
10 company = models.ForeignKey('Company')
11def __str__(self):
12 return "{} on {}".format(
13 self.title,
14 self.pub_date.strftime('%Y-%m-%m'))
15class Meta:
16 verbose_name = 'investment thesis'
17 ordering = ['-pub_date', 'title']
18 get_latest_by = 'pub_date'
19class Company(models.Model):
20 name = models.CharField(max_length=100, db_index=True)
21 slug = models.SlugField(max_length=50, unique=True)
22 description = models.TextField()
23 pe_ratio = models.DecimalField(max_digits=7, decimal_places=2)
24def __str__(self):
25 return self.name
26class Meta:
27 ordering = ['name']
28# Don't forget to save your changes
در مرحله بعد و از طریق اجرای دستورات زیر در واسط خط فرمان، کتابخانه Django یک پایگاه داده postgreSQL برای پروژه مهندسی داده در حال توسعه ایجاد میکند.
1$ (doublebagger) python manage.py makemigrations
2# Then
3$ (doublebagger) python manage.py migrate
4# That's it!
با اجرای دستورات بالا، خروجیهایی مانند شکل زیر تولید میشود:
مهندسی داده با استفاده از نگاشت کننده مدل اشیاء به مدل رابطهای در Django
در این مرحله و پس از مقدمهسازیهای انجام شده، دانشمند داده، برنامهنویس یا توسعهدهنده وب قادر خواهد بود با پایگاه داده postgreSQL، تنها با استفاده از زبان پایتون، تعامل داشته باشد.
برای چنین کاری کافی است تا با استفاده از واسط خط دستوری، مجموعه دستورات زیر، خط به خط اجرا شوند:
1$ (doublebagger) python manage.py shell
با اجرای این دستور، واسطی مانند واسط shell در مفسر پایتون در اختیار کاربر قرار داده میشود؛ با این تفاوت که چنین واسطی، امکان انجام عملیات و دستکاری پایگاههای داده Django را در اختیار کاربر و برنامهنویس قرار میدهد.
1>>> from datetime import date
2>>> from post.models import Post, Company
در مرحله بعد با استفاده از دستور زیر، شیء مرتبط با مدل (مؤلفه) Company ساخته خواهد شد:
1>>> Company.objects.create(name='Apple', slug='Apple-incorporated-nasdaq', description='One of the greatest companies in the world created by the amazing Steve Jobs.', pe_ratio=14.43)
پس از اجرای دستور بالا، با پیغامی مانند پیغام زیر مواجه خواهید شد:
1<Company: Apple>
به عبارت دیگر، با استفاده از دستور بالا و به کمک کتابخانه Django، مدلی برای شرکت APPLE ساخته شد؛ بدون اینکه نیازی به استفاده از دستورات زیر (دستورات دستکاری پایگاههای داده رابطهای) وجود داشته باشد:
1INSERT INTO company
2(name, slug, description, pe_ratio)
3VALUES
4('Apple', 'Apple-incorporated-nasdaq', description='...', pe_ration=14.43);
در ادامه و با استفاده از مجموعه دستورات نمایش داده شده، مدلهای مرتبط با شرکتهای بیشتری در پایگاه داده تولید میشود:
1>>> Company.objects.create(name='Amazon', slug='amzn-nasdaq', description='AWS baby!', pe_ratio=81.48)
2>>> Company.objects.create(name='Microsoft', slug='msft-nasdaq', description='I love GitHub!', pe_ratio=26.02)
3>>> Company.objects.create(name='MongoDB', slug='mdb-nasdaq', description='JSON in the cloud', pe_ratio=100)
4>>> Company.objects.all()
5# Output:
6[<Company: Amazon>, <Company: Apple>, <Company: Microsoft>, <Company: MongoDB>]
- مقاله پیشنهادی: MongoDB چیست ؟ — راهنمای شروع با دیتابیس مانگو دی بی
بنابراین، تا اینجا پایگاه داده برنامه کاربردی در حال توسعه توسط رکوردها یا مدلهای مرتبط با شرکتهای مختلف بهروزرسانی شده است. علاوه بر امکان دستکاری و بهروزرسانی رکوردهای پایگاه داده، امکاناتی نظیر «پرس و جو» (Query) در پایگاه داده توسط دستورات زبان پایتون برای دانشمندان داده، برنامهنویسان و توسعهدهنگان فراهم شده است:
1>>> Company.objects.get(slug__contains='mdb')
2# Output:
3<Company: MongoDB>
همچنین، امکان نمایش رکوردهای پایگاه داده در قالب «چندتایی» (Tuples) نیز وجود دارد:
1>>> Company.objects.values_list()
2# Output:
3[(3, u'Amazon', u'amzn-nasdaq', u'AWS baby!', Decimal('81.48')), (1, u'Apple', u'Apple-incorporated-nasdaq', u'One of the greatest companies in the world created by the amazing Steve Jobs, not so currently under Tim Cook.', Decimal('14.43')), (2, u'Microsoft', u'msft-nasdaq', u'I love GitHub!', Decimal('26.02')), (4, u'MongoDB', u'mdb-nasdaq', u'JSON in the cloud', Decimal('100.00'))]
با استفاده از مجموعه دستورات زیر، شیء مرتبط با مدل (مؤلفه) Post ساخته خواهد شد:
1>>> Post.objects.create(title='I heart Apple', slug='i-heart-apple', text='I heart Apple', company_id=1)
2>>> Post.objects.create(title='Buy more Microsoft', slug='buy-more-microsoft', text="Nadella leads the way", company_id=2)
3>>> Post.objects.create(title='Buy more Amazon', slug='buy-more-amazon', text="Jeff Bezos acquires Mars from Elon Musk", company_id=3)
4>>> Post.objects.create(title='Time to sell MongoDB', slug='time-to-sell-mongdb', text="MongoDB seems a little overvalued", company_id=4)
برای اینکه بتوان اطمینان حاصل کرد که اشیاء مرتبط با مدلهای Post و Company در پایگاه داده postgreSQL وجود دارند، میتوان از دستورات زیر استفاده کرد:
1$ psql -d postgres
2postgres=# \c doublebagger
3doublebagger=# \dt
4doublebagger=# SELECT * FROM post_company;
با اجرای دستورات بالا، خروجی مانند شکل زیر در واسط خط دستوری نمایش داده خواهد شد:
همچنین، امکان استفاده از پرس و جوهای پیشرفتهتری با استفاده از دستورات SQL Join وجود دارد:
1doublebagger=# SELECT * FROM post_company
2doublebagger=# JOIN post_post ON
3doublebagger=# post_company.id = post_post.company_id;
مهندسی داده در پایگاههای داده postgreSQL با کتابخانه Pandas
با استفاده از کتابخانه sqlalchemy (مجموعهای از ابزارها برای دستکاری پایگاههای داده رابطهای و نگاشت کننده مدل اشیاء به مدل رابطهای)، امکان دسترسی به اشیاء زبان SQL از طریق کتابخانه Pandas برای برنامهنویسان و توسعهدهندگان وب فراهم شده است.
با باز کردن یکی از «محیطهای توسعه یکپارچه» (Integrated Development Environment) زبان پایتون نظیر Jupyter Notebook و اجرای دستورات زیر، میتوان به راحتی به مدلهای پایگاه داده رابطهای دسترسی پیدا کرد:
1import pandas as pd
2from sqlalchemy import create_engine
3engine = create_engine('postgresql://sammylee@localhost:5432/doublebagger')
4posts = pd.read_sql('select * from post_post', engine)
5companies = pd.read_sql('select * from post_company', engine)
6posts_companies = pd.merge(companies, posts, left_on='id', right_on='company_id')
7posts_companies
بنابراین، با استفاده از کتابخانه sqlalchemy و امکانات بسیار پیشرفته و قدرتمند کتابخانه Pandas، هر نوع عملیاتی که برای تحلیل و مهندسی داده نیاز است، میتوان انجام داد. اگرچه دانش اولیه از پلتفرم Django برای توسعه تحت وب لازم نیست، با این حال، مسلط شدن به سازوکارهای تعریف شده در کتابخانه Django برای توسعه برنامههای کاربردی تحت وب و استفاده از کتابخانههای Pandas و sqlalchemy جهت دستکاری و دسترسی به مدلهای پایگاه داده postgreSQL، میتواند نقش مهمی در تثبیت جایگاه برنامهنویس به عنوان یک دانشمند داده مسلط به مفاهیم مهندسی داده داشته باشد.
کلام آخر
کتابخانه Django، یک کتابخانه تمام عیار برای توسعه برنامههای کاربردی تحت وب محسوب میشود که مجموعهای از کاملترین ابزارها و امکانات را برای توسعه مؤلفههای اساسی برنامههای کاربردی تحت وب در اختیار کاربران قرار میدهد.
همچنین، کتابخانه Django یک «واسط مدیریتی» (Administration Interface) در اختیار برنامهنویسان و توسعهدهندگان قرار میدهد که عملا نقش «واسط گرافیکی کاربری» (Graphical User Interface | GUI) برای پایگاه داده postgreSQL را ایفا میکند. تنها کاری که لازم است انجام شود این است که مجموعه کدهای زیر به فایل admin.py مدل Post اضافه شود:
1# post/admin.py
2from django.contrib import admin
3from django.db import models
4# Register your models here.
5from .models import Post, Company
6class MyCompanyAdmin(admin.ModelAdmin):
7 model = Company
8 list_display = ('name', 'slug', 'description', 'pe_ratio',)
9admin.site.register(Company, MyCompanyAdmin)
و در مرحله بعد، یک superuser در واسط خط دستوری ایجاد شود:
1$ (doublebagger) python manage.py createsuperuser
2# Then create your credentials
3# start up your local development server and head to your local host
4# and append "/admin" to it
بنابراین، قالب نهایی فایل settings.py در پوشه doublebagger_blog، به شکل زیر خواهد بود:
1"""
2Django settings for doublebagger_blog project.
3Generated by 'django-admin startproject' using Django 1.9.6.
4For more information on this file, see
5https://docs.djangoproject.com/en/1.9/topics/settings/
6For the full list of settings and their values, see
7https://docs.djangoproject.com/en/1.9/ref/settings/
8"""
9
10import os
11
12# Build paths inside the project like this: os.path.join(BASE_DIR, ...)
13BASE_DIR = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))
14
15
16# Quick-start development settings - unsuitable for production
17# See https://docs.djangoproject.com/en/1.9/howto/deployment/checklist/
18
19# SECURITY WARNING: keep the secret key used in production secret!
20
21
22# SECURITY WARNING: don't run with debug turned on in production!
23DEBUG = True
24
25ALLOWED_HOSTS = []
26
27
28# Application definition
29
30INSTALLED_APPS = [
31 'django.contrib.admin',
32 'django.contrib.auth',
33 'django.contrib.contenttypes',
34 'django.contrib.sessions',
35 'django.contrib.messages',
36 'django.contrib.staticfiles',
37 'post',
38]
39
40MIDDLEWARE_CLASSES = [
41 'django.middleware.security.SecurityMiddleware',
42 'django.contrib.sessions.middleware.SessionMiddleware',
43 'django.middleware.common.CommonMiddleware',
44 'django.middleware.csrf.CsrfViewMiddleware',
45 'django.contrib.auth.middleware.AuthenticationMiddleware',
46 'django.contrib.auth.middleware.SessionAuthenticationMiddleware',
47 'django.contrib.messages.middleware.MessageMiddleware',
48 'django.middleware.clickjacking.XFrameOptionsMiddleware',
49]
50
51ROOT_URLCONF = 'doublebagger_blog.urls'
52
53TEMPLATES = [
54 {
55 'BACKEND': 'django.template.backends.django.DjangoTemplates',
56 'DIRS': [],
57 'APP_DIRS': True,
58 'OPTIONS': {
59 'context_processors': [
60 'django.template.context_processors.debug',
61 'django.template.context_processors.request',
62 'django.contrib.auth.context_processors.auth',
63 'django.contrib.messages.context_processors.messages',
64 ],
65 },
66 },
67]
68
69WSGI_APPLICATION = 'doublebagger_blog.wsgi.application'
70
71
72# Database
73# https://docs.djangoproject.com/en/1.9/ref/settings/#databases
74
75DATABASES = {
76 'default': {
77 'ENGINE': 'django.db.backends.postgresql_psycopg2',
78 'NAME': 'doublebagger',
79 'USER': 'sammylee',
80 'PASSWORD': '',
81 'HOST': '127.0.0.1',
82 'PORT': '5432',
83 }
84}
85
86
87# Password validation
88# https://docs.djangoproject.com/en/1.9/ref/settings/#auth-password-validators
89
90AUTH_PASSWORD_VALIDATORS = [
91 {
92 'NAME': 'django.contrib.auth.password_validation.UserAttributeSimilarityValidator',
93 },
94 {
95 'NAME': 'django.contrib.auth.password_validation.MinimumLengthValidator',
96 },
97 {
98 'NAME': 'django.contrib.auth.password_validation.CommonPasswordValidator',
99 },
100 {
101 'NAME': 'django.contrib.auth.password_validation.NumericPasswordValidator',
102 },
103]
104
105
106# Internationalization
107# https://docs.djangoproject.com/en/1.9/topics/i18n/
108
109LANGUAGE_CODE = 'en-us'
110
111TIME_ZONE = 'UTC'
112
113USE_I18N = True
114
115USE_L10N = True
116
117USE_TZ = True
118
119
120# Static files (CSS, JavaScript, Images)
121# https://docs.djangoproject.com/en/1.9/howto/static-files/
122
123STATIC_URL = '/static/'
همچنین، قالب نهایی فایل models.py در پوشه post، بدین شکل نمایش داده خواهد شد:
1from __future__ import unicode_literals
2
3from django.db import models
4
5# Create your models here.
6class Post(models.Model):
7 title = models.CharField(max_length=100)
8 slug = models.SlugField(max_length=50, unique_for_month='pub_date')
9 text = models.TextField()
10 pub_date = models.DateField('date_published', auto_now_add=True)
11 company = models.ForeignKey('Company')
12
13 def __str__(self):
14 return "{} on {}".format(
15 self.title,
16 self.pub_date.strftime('%Y-%m-%m'))
17
18 class Meta:
19 verbose_name = 'investment thesis'
20 ordering = ['-pub_date', 'title']
21 get_latest_by = 'pub_date'
22
23
24class Company(models.Model):
25 name = models.CharField(max_length=100, db_index=True)
26 slug = models.SlugField(max_length=50, unique=True)
27 description = models.TextField()
28 pe_ratio = models.DecimalField(max_digits=7, decimal_places=2)
29
30 def __str__(self):
31 return self.name
32
33 class Meta:
34 ordering = ['name']
کدهای کامل برنامه کاربردی تحت وب توسعه داده شده (DoubleBagger) از طریق لینک [+] قابل دسترسی است.
اگر نوشته بالا برای شما مفید بوده است، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای برنامهنویسی پایتون Python
- گنجینه آموزشهای برنامهنویسی پایتون (Python)
- مجموعه آموزشهای برنامهنویسی
- چگونه برنامهنویسی وب را شروع کنیم؟
- برنامه نویسی وب با پایتون — راهنمای کاربردی
- ترفندهای برنامهنویسی در پایتون — از صفر تا صد
- آموزش پایتون (Python) — مجموعه مقالات جامع وبلاگ فرادرس
^^