پیش بینی سهام با شبکه های عصبی مصنوعی در پایتون — راهنمای کاربردی

۱۵۰۷ بازدید
آخرین به‌روزرسانی: ۲۱ تیر ۱۴۰۲
زمان مطالعه: ۱۴ دقیقه
پیش بینی سهام با شبکه های عصبی مصنوعی در پایتون — راهنمای کاربردی

حوزه‌های «یادگیری ماشین» (Machine Learning) و «یادگیری عمیق» (Deep Learning)، جزء پرمخاطب‌ترین و داغ‌ترین حوزه‌های تحقیقاتی در «هوش مصنوعی» (Artificial Intelligence) محسوب می‌شوند. شرکت‌های بزرگ تجاری، سازمان‌های چند ملیتی و غول‌های صنعت «فناوری اطلاعات» (Information Technology | IT)، تاکنون سرمایه‌گذاری زیادی جهت «تحقیق و توسعه» (Research and Development) در زمینه پیاده‌سازی «سیستم‌های یادگیری هوشمند» (Intelligent Learning Systems) انجام داده‌اند. استفاده از شبکه‌های عصبی برای پیش بینی سهام مالی و قیمت آن‌ها، یکی از کاربردهای روش‌های یادگیری هوشمند محسوب می‌شود.

در حوزه اقتصاد و بخش‌های تجاری-مالی (Financial-Commercial)، از روش‌های یادگیری ماشین و یادگیری عمیق جهت تولید استراتژی‌های مؤثر مالی استفاده می‌شود. از چنین استراتژی‌هایی در «صندوق‌های پوشش ریسک» (Hedge Funds) استفاده می‌شود تا «حاشیه سود» (Profit Margin) سرمایه‌گذاری‌های مالی انجام شده در «بخش‌های» (Sectors) مختلف بیشینه شود.

بنابراین، ترکیب هوش مصنوعی و سیستم‌های تولید استراتژی‌های مالی، موضوع تحقیقاتی جالبی برای علاقه‌مندان به حوزه‌های هوش مصنوعی و مسائل تجاری-مالی خواهد بود. همچنین، ترکیب این دو حوزه، این امکان را برای مخاطبان و خوانندگان این مطلب فراهم می‌آورد تا با کاربردهای هوش مصنوعی در موجودیت‌های مالی نظیر صندوق‌های پوشش ریسک و «شرکت‌های کارگزاری» (Brokerage Companies) آشنا شوند.

این مطلب، در اصل مقدمه‌ای بر استفاده از مدل‌های «شبکه عصبی مصنوعی» (ANN | Artificial Neural Network) نظیر «پرسپترون چند لایه» (Multi-Layer Perceptron | MLP) و «شبکه‌های عصبی بازگشتی» (Recurrent Neural Networks | RNN) با «حافظه کوتاه مدت بلند» (Long Short-Term Memory | LSTM) جهت پیش بینی سهام و نوسان در قیمت شرکت‌های لیست شده در «بازار سهام» (Stock Market) است. به قیمت سهام یک شرکت عرضه شده در بازار سهام، «شاخص» (Index) نیز گفته می‌شود. در این مطلب، به طور خاص روی پیش بینی سهام و قیمت شرکت‌های لیست شده در بازار سهام تمرکز می‌شود. بنابراین، هدف این مطلب پیش بینی سهام و قیمت مرتبط با یکی از شرکت‌های مد نظر کاربران، در یک دوره خاص، با استفاده از شبکه‌های پرسپترون چند لایه و شبکه‌های عصبی بازگشتی است.

پیش بینی سهام

نیاز به شبکه‌های عصبی در اقتصاد و تجارت

حوزه اقتصاد و بخش‌های تجاری-مالی، بسیار «غیرخطی» (Non-Linear) هستند و در بسیاری از مواقع، داده‌های مرتبط با قیمت سهام کاملا «تصادفی» (Random) به نظر می‌رسند. روش‌های «سری‌های زمانی» (Time Series) سنتی نظیر «میانگین متحرک خودهمبسته یکپارچه» (ARIMA | AutoRegressive Integrated Moving Average) و «واریانس ناهمسانی شرطی اتورگرسیو» (Autoregressive Conditional Heteroskedasticity | GARCH)، تنها زمانی در پیش بینی سهام و قیمت‌های آن مؤثر هستند که داده‌های سری وارد شده به سیستم «مانا» (Stationary) باشند.

فرض مانا بودن داده‌های سری زمانی، «فرض محدود کننده‌ای» (Restricting Assumption) برای سیستم خواهد بود. در چنین حالتی و با فرض مانا بودن داده‌های سری زمانی، این داده‌ها باید از طریق تبدیلاتی نظیر Log Returns «پیش‌پردازش» (Pre-Process) شوند تا برای مدل‌سازی قیمت سهام و سود شرکت‌ها مورد استفاده قرار بگیرند. در سیستم‌های مالی مرسوم، به جای اینکه از مقادیر واقعی قیمت سهام یا مقادیر واقعی «سود سرمایه‌گذاری» (Returns) استفاده شود، از «لگاریتم» (Log) این مقادیر  برای پیش بینی سهام و قیمت آن‌ها استفاده می‌شود.

با این حال، مشکل اصلی در فرض مانا بودن داده‌های سری زمانی، مواقعی نمایان می‌شود که از مدل‌های پیاده‌سازی شده برای انجام پیش‌بینی در «سیستم‌های معاملات تجاری لایو» (Live Trading Systems) استفاده می‌شود. در سیستم‌های معاملات تجاری لایو، برخلاف «سیستم‌های معاملات تجاری کاغذی» (Paper Trading Systems)، از پول واقعی برای انجام معاملات استفاده می‌شود؛ در نتیجه، حاشیه خطای بسیار کمی برای سیستم وجود خواهد داشت. نکته مهم در مورد سیستم‌های معاملات تجاری لایو این است که هیچ تضمینی وجود ندارد که داده‌های سری زمانی ورودی به سیستم، مانا باشند. بنابراین، احتمال عملکرد نادرست چنین سیستم‌هایی بسیار بالاست.

برای رفع چنین نقیصه‌ای، می‌توان از شبکه‌های عصبی مصنوعی استفاده کرد. ویژگی مهم استفاده از شبکه‌های عصبی مصنوعی در سیستم‌های مالی، عدم فرض مانا بودن داده‌های سری زمانی است. علاوه بر این، شبکه‌های عصبی مصنوعی، سیستم‌های بسیار مؤثری جهت پیدا کردن «روابط» (Relationships) میان داده‌ها، مدل‌سازی آن‌ها و استفاده از مدل‌های تولید شده برای انجام «پیش‌بینی» (Prediction) در مورد داده‌های جدید (یا «دسته‌‎بندی» (Classify) داده‌های جدید) محسوب می‌شوند.

به طور کلی، یک پروژه تعریف شده در حوزه «علم داده» (Data Science) شامل مراحل زیر خواهد بود:

  • «اکتساب یا جمع‌آوری داده‌ها» (Data Acquisition): در این مرحله، داده‌های خام لازم برای یک پروژه علم داده (نظیر پیش بینی سهام و قیمت آن) جمع‌آوری می‌شود. این داده‌ها، «ویژگی‌های» (Features) لازم را برای پیاده‌سازی یک مدل یادگیری هوشمند فراهم می‌آورند.
  • پیش‌پردازش داده‌ها: بسیاری از «دانشمندان علم داده» (Data Scientists) و «مهندسان هوش مصنوعی» (Artificial Intelligence Engineers)، از این مرحله به دلیل وقت‌گیر بودن و نیاز به صرف انرژی زیاد، فراری هستند. با این حال، پیش‌‌پردازش داده‌های ورودی به سیستم، یکی از حیاتی‌ترین بخش‌های پیاده‌سازی یک پروژه مرتبط با علم داده محسوب می‌شود.
  • توسعه و پیاده‌سازی مدل‌ها: در این مرحله، توسعه‌دهندگان، مدل‌های لازم (در این مطلب، مدل‌های استفاده شده از نوع شبکه‌های عصبی مصنوعی هستند) برای پیاده‌سازی سیستم و پارامترهای بهینه آن‌ها را مشخص می‌کنند.
  • «مدل بَک‌تست» (Backtest Model): فرایندی است که در آن، عملکرد استراتژی‌های تولید شده برای معاملات تجاری یا «مدل‌های تحلیلی» (Analytical Models) پیاده‌سازی شده (جهت پیش بینی سهام و قیمت آن‌ها و همچنین سود شرکت‌ها)، روی «داده‌های تاریخی» (Historical Data) ارزیابی می‌شوند. هدف از چنین فرایندی، سنجش میزان «دقت» (Accuracy) مدل تحلیلی یا استراتژی مالی تولید شده، در پیش‌بینی نتایج واقعی است.
  • «بهینه‌سازی» (Optimization) پارامترها: در این مرحله، بهینه‌ترین و مناسب‌ترین پارامترها جهت آموزش مدل یادگیری هوشمند (شبکه‌‌های عصبی مصنوعی) انتخاب می‌شوند. این مرحله، اختیاری است. از آنجایی که هدف این مطلب، آشنایی خوانندگان و مخاطبان با روش‌های یادگیری هوشمند جهت پیش بینی سهام و قیمت آن‌ها است، بهینه‌سازی پارامترها گنجانده نشده است. با این حال، این مبحث می‌تواند تأثیر مثبتی در بهبود عملکرد مدل‌های شبکه عصبی داشته باشد.

اکتساب یا جمع‌آوری داده‌ها

خوشبختانه، داده‌های مرتبط با قیمت سهام، که در این پروژه مورد نیاز است، توسط وب‌سایت (Yahoo Finance) برای استفاده عمومی در اختیار قرار گرفته است. داده‌های مرتبط با قیمت سهام شرکت‌ها، یا از طریق وب‌سایت (Yahoo Finance) و یا از طریق «واسط برنامه‌نویسی کاربردی» (Application Programming Interface) ارائه شده توسط این وب‌سایت، قابل دریافت یا جمع‌آوری است.

با استفاده از قطعه کد زیر در «زبان برنامه‌نویسی پایتون» (Python Programming Language)، داده‌های مورد نیاز برای آموزش مدل یادگیری جمع‌آوری خواهد شد (نکته: برخی از پارامترهای کدهای ارائه شده، باید قبل از اجرا توسط کاربران مقداردهی شوند).

1import pandas_datareader.data as pdr
2import fix_yahoo_finance as fix
3import time
4fix.pdr_override()
5
6
7def get_stock_data(ticker, start_date, end_date):
8    """
9    Gets historical stock data of given tickers between dates
10    :param ticker: company, or companies whose data is to fetched
11    :type ticker: string or list of strings
12    :param start_date: starting date for stock prices
13    :type start_date: string of date "YYYY-mm-dd"
14    :param end_date: end date for stock prices
15    :type end_date: string of date "YYYY-mm-dd"
16    :return: stock_data.csv
17    """
18    i = 1
19    try:
20        all_data = pdr.get_data_yahoo(ticker, start_date, end_date)
21    except ValueError:
22        print("ValueError, trying again")
23        i += 1
24        if i < 5:
25            time.sleep(10)
26            get_stock_data(ticker, start_date, end_date)
27        else:
28            print("Tried 5 times, Yahoo error. Trying after 2 minutes")
29            time.sleep(120)
30            get_stock_data(ticker, start_date, end_date)
31    stock_data = all_data["Adj Close"]
32    stock_data.to_csv("stock_prices.csv")
33
34
35def get_sp500(start_date, end_date):
36    """
37    Gets sp500 price data
38    :param start_date: starting date for sp500 prices
39    :type start_date: string of date "Y-m-d"
40    :param end_date: end date for sp500 prices
41    :type end_date: string of date "Y-m-d"
42    :return: sp500_data.csv
43    """
44    i = 1
45    try:
46        sp500_all_data = pdr.get_data_yahoo("SPY", start_date, end_date)
47    except ValueError:
48        print("ValueError, trying again")
49        i += 1
50        if i < 5:
51            time.sleep(10)
52            get_stock_data(start_date, end_date)
53        else:
54            print("Tried 5 times, Yahoo error. Trying after 2 minutes")
55            time.sleep(120)
56            get_stock_data(start_date, end_date)
57    sp500_data = sp500_all_data["Adj Close"]
58    sp500_data.to_csv("sp500_data.csv")
59
60
61if __name__ == "__main__":
62    get_stock_data("AAPL", "2018-05-01", "2018-06-01")
63    # get_sp500("2018-05-01", "2018-06-01")

با استفاده از کد بالا، داده‌های سری زمانی مرتبط با قیمت سهام یک شرکت خاص (در این مورد خاص، برای پیش بینی سهام شرکت اپل (APPLE)) جمع‌آوری می‌شوند.

پیش‌پردازش داده‌ها

در این مطلب و برای پیش بینی سهام شرکت‌ها و قیمت آن‌ها، نیاز است تا داده‌های جمع‌آوری شده به «مجموعه‌های آموزشی» (Training Sets) متشکل از ده داده مرتبط با قیمت سهام یک شرکت و یک داده متناظر با قیمت روز بعد سهام آن شرکت تقسیم‌بندی شوند. در این پروژه، برای انجام موارد بالا، کلاسی به نام DataProcessing تعریف می‌شود. سپس، داده‌های جمع‌آوری شده به دو دسته «داده‌های آموزشی» (Training Data) و «داده‌های تست» (Test Data) تقسیم‌بندی می‌شوند.

برای تولید داده‌های آموزشی، تابعی به نام (get_train(self, seq_len تعریف شده است؛ ورودی این تابع، یک پارامتر اندازه پنجره (در اینجا، مقدار 10 به عنوان ورودی دریافت می‌شود و متناظر با ده داده مرتبط با قیمت سهام یک شرکت است) و خروجی آن، داده‌های آموزشی (داده و خروجی مورد انتظار) در قالب آرایه‌های تعریف شده به وسیله کتابخانه نرم‌افزاری (numpy) است. برای تولید داده‌های تست نیز، تابعی مشابه با تابع تولید کننده داده‌های آموزشی تعریف می‌شود.

با استفاده از قطعه کد زیر، داده‌های لازم برای تولید داده‌های آموزشی و تست (جهت آموزش و تست شبکه‌های عصبی پیاده‌سازی شده) تولید می‌شوند:

1import pandas as pd
2import numpy as np
3
4
5class DataProcessing:
6    def __init__(self, file, train):
7        self.file = pd.read_csv(file)
8        self.train = train
9        self.i = int(self.train * len(self.file))
10        self.stock_train = self.file[0: self.i]
11        self.stock_test = self.file[self.i:]
12        self.input_train = []
13        self.output_train = []
14        self.input_test = []
15        self.output_test = []
16
17    def gen_train(self, seq_len):
18        """
19        Generates training data
20        :param seq_len: length of window
21        :return: X_train and Y_train
22        """
23        for i in range((len(self.stock_train)//seq_len)*seq_len - seq_len - 1):
24            x = np.array(self.stock_train.iloc[i: i + seq_len, 1])
25            y = np.array([self.stock_train.iloc[i + seq_len + 1, 1]], np.float64)
26            self.input_train.append(x)
27            self.output_train.append(y)
28        self.X_train = np.array(self.input_train)
29        self.Y_train = np.array(self.output_train)
30
31    def gen_test(self, seq_len):
32        """
33        Generates test data
34        :param seq_len: Length of window
35        :return: X_test and Y_test
36        """
37        for i in range((len(self.stock_test)//seq_len)*seq_len - seq_len - 1):
38            x = np.array(self.stock_test.iloc[i: i + seq_len, 1])
39            y = np.array([self.stock_test.iloc[i + seq_len + 1, 1]], np.float64)
40            self.input_test.append(x)
41            self.output_test.append(y)
42        self.X_test = np.array(self.input_test)
43        self.Y_test = np.array(self.output_test)

توسعه و پیاده‌سازی مدل‌های پیش بینی سهام

در این بخش، مدل‌های پیاده‌سازی شده (شبکه عصبی پرسپترون چند لایه و شبکه عصبی بازگشتی با حافظه کوتاه مدت بلند) برای پیش بینی سهام شرکت‌ها و قیمت آن‌ها روی داده‌های سری زمانی، معرفی خواهند شد.

لازم به ذکر است که برای پیاده‌‎سازی این مدل‌ها در زبان برنامه‌نویسی پایتون، «وابستگی‌های برنامه‌نویسی» (Programming Dependencies) زیر باید در محیط برنامه‌نویسی پایتون «وارد» (Import) شوند.

  • بسته نرم‌افزاری pandas-datareader
  • بسته نرم‌افزاری fix-yahoo-finance
  • بسته نرم‌افزاری numpy
  • بسته نرم‌افزاری pandas
  • بسته نرم‌افزاری tensorflow
  • بسته نرم‌افزاری keras

شبکه‌های عصبی مصنوعی

در این پروژه، از دو مدل شبکه عصبی مصنوعی جهت پیش بینی سهام شرکت‌ها و قیمت آن‌ها استفاده است: شبکه عصبی پرسپترون چند لایه و شبکه عصبی بازگشتی با حافظه کوتاه مدت بلند. در ادامه، تعریفی مختصری از نحوه عملکرد این دسته از مدل‌های شبکه عصبی مصنوعی ارائه خواهد شد.

شبکه عصبی پرسپترون چند لایه

شبکه عصبی پرسپترون چند لایه، یکی از ساده‌ترین مدل‌های شبکه عصبی مصنوعی است. در این مدل، ابتدا ورودی‌ها وارد مدل مدل‌می‌شوند. در مرحله بعد، با در اختیار داشتن مجموعه‌ای از وزن‌های متناظر با نودهای شبکه‌های عصبی، ورودی‌ها از لایه ورودی به سمت لایه‌های نهان و پس از آن به سمت لایه خروجی انتشار داده می‌شوند (انتشار رو به جلوی نمونه‌های ورودی).

یادگیری شبکه عصبی پرسپترون چند لایه از طریق یک فرایند یادگیری به نام «پس انتشار خطا» (Error Backpropagation) انجام می‌شود. در این فرایند، خطای پیش‌بینی انجام شده در لایه خروجی شبکه، به سمت لایه‌های نهان پس انتشار داده می‌شود (انتشار رو به عقب خطای شبکه) و از این طریق، وزن‌های نودهای شبکه‌های عصبی تغییر می‌کنند.

پیش بینی سهام

 

مشکل مهم شبکه عصبی پرسپترون چند لایه، نبود حافظه است. به عبارت دیگر، شبکه هیچ اطلاعی در مورد نمونه‌های آموزشی که در تکرارهای گذشته وارد شبکه عصبی شده‌اند ندارد و نمی‌تواند تأثیر آموزش‌های گذشته را بر نمونه‌های آموزشی جدید بسنجد. در زمینه مدل‌های یادگیری جهت پیش بینی سهام شرکت‌ها و قیمت آن‌ها، تفاوت میان داده‌های مرتبط با ده روز خاص در یک مجموعه داده، با داده‌های مرتبط با همان ده روز در مجموعه داده دیگر، ممکن از اهمیت ویژه‌ای برخوردار باشد. با این حال، شبکه عصبی پرسپترون چند لایه قادر به تحلیل چنین روابطی در داده‌ها نخواهد بود.

در چنین حالتی و برای رفع چنین نقیصه‌ای در شبکه عصبی پرسپترون چند لایه، از شبکه عصبی بازگشتی با حافظه کوتاه مدت بلند استفاده می‌شود. شبکه عصبی بازگشتی، قابلیت ذخیره اطلاعات خاصی را در مورد داده‌های ورودی دارد و می‌تواند از این اطلاعات در مراحل بعدی یادگیری استفاده کند. چنین ویژگی مهمی در شبکه عصبی بازگشتی، قابلیت شبکه در تحلیل ساختار پیچیدۀ روابط میان داده‌های قیمت سهام را به شدت افزایش می‌دهد.

مهم‌ترین مشکل شبکه‌های عصبی بازگشتی، «محو شدگی گرادیان» (Vanishing Gradient) است. دلیل وقوع چنین پدیده‌ای این است که با بالا رفتن تعداد لایه‌ها در شبکه، «نرخ یادگیری» (Learning Rate) چندین بار ضرب خواهد شد (نرخ یادگیری، مقداری کوچک‌تر از 1 است) و این سبب می‌شود تا مقادیر گرادیان‌های محاسبه شده مدام کاهش پیدا کنند. در نتیجه، در تکرارهای رو به انتها، وزن‌های شبکه عصبی تغییر محسوسی نخواهد کرد. چنین مشکلی با اضافه شدن واحد حافظه کوتاه مدت بلند (LSTM) به شبکه عصبی بازگشتی مرتفع شده است. به همین دلیل، شبکه عصبی بازگشتی با حافظه کوتاه مدت بلند، عملکرد بهتری نسبت به شبکه‌های عصبی بازگشتی مرسوم از خود نشان می‌دهد.

 

معماری شبکه عصبی بازگشتی با حافظه کوتاه مدت بلند (LSTM) - برای دیدن عکس در اندازه بزرگتر، روی آن کلیک کنید.

برای پیاده‌سازی مدل‌های شبکه عصبی مصنوعی ذکر شده، از کتابخانه keras استفاده می‌شود. ویژگی مهم در کتابخانه keras، اضافه کردن مرحله به مرحلۀ لایه‌ها، به جای تعریف یک‌باره مدل است. از این طریق، به راحتی می‌توان تعداد لایه‌ها و نوع آن‌ها را تغییر داد؛ ویژگی مشخصه‌ای که در هنگام «بهینه‌سازی» (Optimization) شبکه عصبی بسیار مفید خواهد بود.

یکی از مهم‌ترین بخش‌های پیاده‌سازی مدل، به ویژه در هنگام استفاده از داده‌ها برای آموزش آن‌ها، «نرمال‌سازی» (Normalization) داده‌های ورودی است. روش معمول نرمال‌سازی داده‌ها، روش «نمره استاندارد» (Standard Score) است. با این حال، از آنجایی که قرار است از سیستم پیاده‌سازی شده جهت پیش‌بینی در سیستم‌های معاملات تجاری لایو (در یک بازه زمانی) استفاده شود، استفاده از روش آماری نمره استاندارد ممکن است روش دقیقی برای نرمال‌سازی داده‌ها نباشد.

در این پروژه، جهت نرمال‌سازی داده‌ها، تمامی نمونه‌های داده‌ای بر عدد 200 تقسیم می‌شوند (یک عدد دلخواه که سبب کوچک شدن تمامی مقادیر داده‌ای می‌شود). اگر چه ممکن است این روش کمی اختیاری به نظر برسد، با این حال، از بزرگ شدن مقادیر وزن‌های نودهای شبکه عصبی به شکل مؤثری جلوگیری می‌کند.

از طریق تعریف یک «مدل ترتیبی» (Sequential Model) و اضافه کردن «لایه‌های متراکم» (Dense Layers) روی آن، می‌توان به راحتی یک شبکه عصبی پرسپترون چند لایه ایجاد کرد.

1model = tf.keras.models.Sequential()
2model.add(tf.keras.layers.Dense(100, activation=tf.nn.relu))
3model.add(tf.keras.layers.Dense(100, activation=tf.nn.relu))
4model.add(tf.keras.layers.Dense(1, activation=tf.nn.relu))
5model.compile(optimizer="adam", loss="mean_squared_error")

از طریق کد بالا، یک شبکه عصبی پرسپترون چند لایه متشکل از دو لایه نهان ایجاد می‌شود. در هر کدام از لایه‌های نهان از 100 نود (یا نرون) استفاده می‌شود. همچنین، از بهینه‌ساز Adam (یا Adam Optimizer) جهت به روز رسانی وزن‌ها استفاده می‌شود. این الگوریتم، جایگزین الگوریتم استاندارد «گرادیان کاهشی تصادفی» (Stochastic Gradient Descent) خواهد شد. به دلیل عملکرد بهتر بهینه‌ساز Adam نسبت به الگوریتم گرادیان کاهشی تصادفی، این روش محبوبیت دوچندانی در میان فعالان حوزه یادگیری ماشین پیدا کرده است.

برای روشن‌تر شدن دلیل برتری روش بهینه‌ساز Adam، ابتدا ویژگی‌ها و نقاط مثبت دو روش مبتنی بر گرادیان کاهشی تصادفی ذکر خواهد شد. سپس، دلیل برتری  روش بهینه‌ساز Adam بیان خواهد شد:

  • «الگوریتم گرادیان انطباقی» (Adaptive Gradient Algorithm | AdaGrad): در این روش، از یک نرخ یادگیری به ازاء هر پارامتر (Per-Parameter Learning Rate) برای یادگیری استفاده می‌شود. این روش، عملکرد شبکه عصبی را در حل مسائلی که «گرادیان‌های اسپارس» (Sparse Gradients) دارند، بهبود می‌بخشد (نظیر مسائل مرتبط با «پردازش زبان طبیعی» (Natural Language Processing) و «بینایی کامپیوتر» (Computer Vision)).
  • روش «انتشار ریشه میانگین مربعات» (Root Mean Square Propagation | RMSProp): در این روش نیز همانند روش بالا، از یک نرخ یادگیری به ازاء هر پارامتر برای یادگیری استفاده می‌شود. این نرخ‌ها، بر اساس میانگین مقادیر اخیر گرادیان‌های وزن‌ها (در اصل، بر اساس میزان سرعت تغییر وزن‌ها) تطبیق داده می‌شوند. این الگوریتم در مسائل «آنلاین» (Online | برخط) و «نامانا» (Non-Stationary) بسیار خوب عمل می‌کند.

روش بهینه‌ساز Adam، ویژگی‌ها و نقاط مثبت دو روش بالا را با هم ترکیب می‌کند و به همین خاطر است که عملکرد بهتری نسبت به روش‌های گرادیان کاهشی تصادفی از خود نشان می‌دهد. در مرحله بعد، مدل شبکه عصبی روی داده‌های آموزشی «برازش» (Fit) می‌شود.

1model.fit(X_train, Y_train, epochs=100)

پس از برازش مدل روی داده‌های آموزشی، از داده‌های تست برای ارزیابی عملکرد آن استفاده می‌شود. نتایج به دست آمده از ارزیابی مدل روی داده‌های تست، برای سنجش عملکرد سیستم در تعمیم آموزش شبکه به مرحله تست و قابلیت مدل در پیش بینی سهام شرکت‌ها و قیمت آن‌ها مورد استفاده قرار می‌گیرند.

1model.evaluate(X_test, Y_test)

کد کامل پیاده‌سازی شبکه عصبی پرسپترون چند لایه در زبان برنامه‌نویسی پایتون، برای پیش‌ بینی سهام شرکت‌ها و قیمت آن‌ها، در ادامه آمده است:

1import get_prices as hist
2import tensorflow as tf
3from preprocessing import DataProcessing
4# import pandas_datareader.data as pdr if using the single test below
5import fix_yahoo_finance as fix
6fix.pdr_override()
7
8start = "2003-01-01"
9end = "2018-01-01"
10
11hist.get_stock_data("AAPL", start_date=start, end_date=end)
12process = DataProcessing("stock_prices.csv", 0.9)
13process.gen_test(10)
14process.gen_train(10)
15
16X_train = process.X_train / 200
17Y_train = process.Y_train / 200
18
19X_test = process.X_test / 200
20Y_test = process.Y_test / 200
21
22model = tf.keras.models.Sequential()
23model.add(tf.keras.layers.Dense(100, activation=tf.nn.relu))
24model.add(tf.keras.layers.Dense(100, activation=tf.nn.relu))
25model.add(tf.keras.layers.Dense(1, activation=tf.nn.relu))
26
27model.compile(optimizer="adam", loss="mean_squared_error")
28
29model.fit(X_train, Y_train, epochs=100)
30
31print(model.evaluate(X_test, Y_test))
32
33# If instead of a full backtest, you just want to see how accurate the model is for a particular prediction, run this:
34# data = pdr.get_data_yahoo("AAPL", "2017-12-19", "2018-01-03")
35# stock = data["Adj Close"]
36# X_predict = np.array(stock).reshape((1, 10)) / 200
37# print(model.predict(X_predict)*200)

شبکه عصبی بازگشتی با حافظه کوتاه مدت بلند

برای پیاده‌سازی شبکه عصبی بازگشتی با حافظه کوتاه مدت بلند، از رویه‌ای مشابه با پیاده‌سازی شبکه عصبی پرسپترون چند لایه استفاده می‌شود. کد کامل پیاده‌سازی شبکه عصبی بازگشتی با حافظه کوتاه مدت بلند در زبان برنامه‌نویسی پایتون، جهت پیش‌ بینی سهام شرکت‌ها و قیمت آن‌ها، در ادامه نمایش داده شده است:

1import pandas as pd
2import numpy as np
3import get_prices as hist
4import tensorflow as tf
5from preprocessing import DataProcessing
6import pandas_datareader.data as pdr
7import fix_yahoo_finance as fix
8fix.pdr_override()
9
10start = "2003-01-01"
11end = "2018-01-01"
12
13hist.get_stock_data("AAPL", start_date=start, end_date=end)
14process = DataProcessing("stock_prices.csv", 0.9)
15process.gen_test(10)
16process.gen_train(10)
17
18X_train = process.X_train.reshape((3379, 10, 1)) / 200
19Y_train = process.Y_train / 200
20
21X_test = process.X_test.reshape(359, 10, 1) / 200
22Y_test = process.Y_test / 200
23
24model = tf.keras.Sequential()
25model.add(tf.keras.layers.LSTM(20, input_shape=(10, 1), return_sequences=True))
26model.add(tf.keras.layers.LSTM(20))
27model.add(tf.keras.layers.Dense(1, activation=tf.nn.relu))
28
29model.compile(optimizer="adam", loss="mean_squared_error")
30
31model.fit(X_train, Y_train, epochs=50)
32
33print(model.evaluate(X_test, Y_test))
34
35data = pdr.get_data_yahoo("AAPL", "2017-12-19", "2018-01-03")
36stock = data["Adj Close"]
37X_predict = np.array(stock).reshape((1, 10, 1)) / 200
38
39print(model.predict(X_predict)*200)
40
41# If instead of a full backtest, you just want to see how accurate the model is for a particular prediction, run this:
42# data = pdr.get_data_yahoo("AAPL", "2017-12-19", "2018-01-03")
43# stock = data["Adj Close"]
44# X_predict = np.array(stock).reshape((1, 10)) / 200
45# print(model.predict(X_predict)*200)
46© 2019 GitHub, Inc.

نکته مهم در مورد استفاده از داده‌های ورودی برای آموزش و تست شبکه عصبی این است که در کتابخانه keras، داده‌های آموزشی و تست باید ابعاد مشخصی داشته باشند (ابعاد داده‌های آموزشی و تست توسط داده‌های ورودی تعیین می‌شود). در نتیجه، تغییر شکل داده‌ها با استفاده از تابع reshape در کتابخانه numpy ضروری است.

بَک‌تست مدل‌های آموزش دیده و تست شده

پس از اینکه مدل‌های شبکه عصبی پیاده‌سازی شده روی داده‌های آموزشی، برازش و روی داده‌های تست، ارزیابی شدند، می‌توانیم یک گام جلوتر در جهت ارزیابی مدل‌ها برداریم.همانطور که پیش از این نیز اشاره شد، بَک‌تست فرایندی است که در آن، الگوریتم پیاده‌سازی شده جهت پیش‌بینی معاملات مالی-تجاری، روی داده‌های تاریخی و با هدف سنجش میزان دقت مدل در پیش‌بینی نتایج واقعی، ارزیابی می‌شود. برای چنین کاری از قطعه کد زیر استفاده می‌شود.

1import pandas_datareader.data as pdr
2import fix_yahoo_finance as fix
3import numpy as np
4fix.pdr_override()
5
6
7def back_test(strategy, seq_len, ticker, start_date, end_date, dim):
8    """
9    A simple back test for a given date period
10    :param strategy: the chosen strategy. Note to have already formed the model, and fitted with training data.
11    :param seq_len: length of the days used for prediction
12    :param ticker: company ticker
13    :param start_date: starting date
14    :type start_date: "YYYY-mm-dd"
15    :param end_date: ending date
16    :type end_date: "YYYY-mm-dd"
17    :param dim: dimension required for strategy: 3dim for LSTM and 2dim for MLP
18    :type dim: tuple
19    :return: Percentage errors array that gives the errors for every test in the given date range
20    """
21    data = pdr.get_data_yahoo(ticker, start_date, end_date)
22    stock_data = data["Adj Close"]
23    errors = []
24    for i in range((len(stock_data)//10)*10 - seq_len - 1):
25        x = np.array(stock_data.iloc[i: i + seq_len, 1]).reshape(dim) / 200
26        y = np.array(stock_data.iloc[i + seq_len + 1, 1]) / 200
27        predict = strategy.predict(x)
28        while predict == 0:
29            predict = strategy.predict(x)
30        error = (predict - y) / 100
31        errors.append(error)
32        total_error = np.array(errors)
33    print(f"Average error = {total_error.mean()}")
34    # If you want to see the full error list then print the following statement
35    # print(errors)

روش بَک‌تست ارائه شده در این روش، روش ساده‌ای است. روش‌های بَک‌تستِ پیشرفته برای ارزیابی مدل‌های پیش‌بینی در سیستم‌های مالی، عوامل خارجی نظیر «هزینه‌های معاملات» (Transaction Costs)، «تغییرات نظام بازار» (Market Regime Change) و سایر موارد را در هنگام ارزیابی مدل‌ها در نظر می‌گیرند. با این حال، از آنجایی که هدف این مطلب آموزشی است، ارائه یک روش بَک‌تست ساده کفایت می‌کند.

شکل زیر، عملکرد مدل شبکه عصبی بازگشتی با حافظه کوتاه مدت بلند (LSTM) را در پیش بینی سهام شرکت اپل (APPLE) و قیمت آن‌ها در ماه «فوریه» (February) میلادی نمایش می‌دهد.

پیش بینی سهام

عملکرد نمایش داده شده در بالا، بدون استفاده از روش‌های بهینه‌سازی پارامترها حاصل شده است. برای یک مدل شبکه عصبی بازگشتی با حافظه کوتاه مدت بلند (LSTM)، چنین نتایجی حاکی از عملکرد خوب آن‌ها در پیش بینی سهام و قیمت آن‌ها (در این مورد، قیمت سهام شرکت اپل) دارد. همچنین، این نتایج قدرت شبکه‌های عصبی و مدل‌های یادگیری ماشین را در مدل‌سازی روابط پیچیده میان پارامترها نشان می‌دهد.

جمع‌بندی

روش‌های یادگیری ماشین به سرعت در حال تکامل هستند و الگوریتم‌های جدید و بدیعی در این حوزه در حال پیاده‌سازی شدن هستند. یکی از راه‌هایی که از طریق آن دانش برنامه‌نویسان در مورد مدل‌های یادگیری هوشمند افزایش می‌یابد، پیاده‌سازی کاربردهایی نظیر پیش‌بینی قیمت سهام توسط شبکه‌های عصبی مصنوعی است.

اگرچه شبکه عصبی LSTM پیاده‌سازی شده در این مطلب، عملکرد خیلی دقیقی در پیش‌بینی قیمت سهام ندارد و برای استفاده کاربردی جهت پیش‌بینی در سیستم‌های معاملات تجاری لایو مناسب نیست، اما می‌توان در آینده، از بنیان مدل‌‌های پیاده‌سازی شده در این مطلب و بهبود آن‌ها، جهت تولید یک سیستم معاملات تجاری لایو برای پیش‌بینی قیمت سهام استفاده کرد.

اگر نوشته بالا برای شما مفید بوده است، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

^^

بر اساس رای ۱۳ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
Medium
۲ دیدگاه برای «پیش بینی سهام با شبکه های عصبی مصنوعی در پایتون — راهنمای کاربردی»

سلام ممنون از سایت خوبتون..من کد های شبکه عصبی در سایت رو دیدم ولی برای قسمتی از تحقیقم کدشبکه عصبی GRU (گیت ) رو میخوام که نتونستم پیدا کنم میشه لطف کنین برام ایمیل کنین

model = tf.keras.models.Sequential()

سلام
چرا tf قبلا تعریف نشده؟
مشکل از کجاست؟

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *