Viết cho những chuyển động của cuộc sống quanh tôi

Thứ Tư, 21 tháng 8, 2013

Fractal và VN Index

Phương pháp Rescaled-range Analysis

Nguồn: Kết quả từ Matlab.

Phương pháp MFDFA1

Biểu đồ kết quả của phương pháp MFDFA1. Nguồn: Phần mềm Matlab.

Biểu đồ phần phối xác suất giá trị H của phương pháp MFDFA1.

Phương pháp MFDFA2

Biểu đồ kết quả của phương pháp MFDFA2. Nguồn: Phần mềm Matlab.

Biểu đồ phần phối xác suất giá trị H của phương pháp MFDFA2.

Phương pháp MFDFA3

Biểu đồ kết quả của phương pháp MFDFA3. Nguồn: Phần mềm Matlab.

Biểu đồ phần phối xác suất giá trị H của phương pháp MFDFA3.

Tổng hợp giá trị của H với các phương pháp khác nhau.

q	MFDFA1	MFDFA2	MFDFA3
-5	1.02	1.04	1.37
-3	0.92	0.95	1.26
-1	0.75	0.80	0.94
0	0.70	0.74	0.79
1	0.67	0.70	0.72
DFA	0.65	0.67	0.69
3	0.63	0.64	0.65
5	0.60	0.61	0.61

Thứ Ba, 20 tháng 8, 2013

Giới thiệu về hình học Fractal

Sự phát triển của hình học qua các thời đại đã đóng góp những thành tựu quan trọng trong lịch sử văn minh nhân loại. Ở các nền văn hóa cổ của Babilon và Ai cập, con người đã biết cách tính diện tích các hình đơn giản như tam giác, hình thang, hình tròn và cũng biết cách tính thể tích một số vật thể đơn giản như hình hộp chữ nhật, hình chóp đáy vuông…

Từ thế kỷ thứ VII đến thế kỷ thứ III trước công nguyên, các nhà hình học Hy Lạp đã có những đóng góp quan trọng trong việc phát triển môn hình học. Họ đõ cố gắng tập hợp và sắp xếp các hiểu biết về hình học theo một kết cấu logic nhất định. Trong số đó, người có công lớn nhất, đặt nền móng cho cơ sở hình học chính là Euclide (330 – 275 TCN) với tác phẩm “Nguyên lý”. Trong tác phẩm của mình, Euclid đã trình bày đầy đủ và có hệ thống, tìm ra cách chứng minh nhiều định lý và sắp xếp chúng theo một trình tự logic. Ngày nay, các nhà toán học đương đại cũng khẳng định rằng tác phẩm “Nguyên lý” của Euclide đã có những đóng góp to lớn trong trong việc cố gắng xây dựng hình học theo một hệ thống logic chặt chẽ. Tuy nhiên, đứng trên quan điểm của toán học hiện đại thì tác phẩm “Nguyên lý” của Euclide vẫn còn nhiều thiếu sót về phương diện đặt cơ sở logic cho việc xây dựng hình học.

Cuối thế kỷ XIX, nhà toán học người Đức David Hilbert (1862 – 1943) mới khắc phục được những thiếu sót của Euclide với tác phẩm “Cơ sở hình học” năm 1899. Trong tác phẩm của mình, Hilbert đã đưa ra một hệ tiên đề đầy đủ của hình học Euclide, từ đó suy diễn để thu được tất cả các nội dung của hình học Euclide.

Trong quá trình cố gắng thử chứng minh định đề V của Euclide đã dẫn đến sự ra đời của một môn hình học mới khác với hình học Euclide. Cuối những năm ba mươi của thế kỷ XIX, nhà toán học người Nga Lôbasepxki (Nikolai Ivanovitch Lobatchevski, 1792 – 1856), giáo sư trường Đại học Tổng hợp Kadan (Nga) đã đưa ra lời giải đáp về vấn đề định đề V của Euclide. Ông đã khẳng định: định đề V không thể suy ra từ các tiên đề và định đề còn lại của Euclide. Lôbasepxki đã phát triển hình học của mình không thua kém hình học Euclide, người ta gọi nó là hình học phi Euclide hay hình học Lôbasepxki.

Hình 1. Chân dung của nhà toán học Euclide và Hilbert

Giữa thế kỷ XX, khi công nghệ điện toán phát triển, một môn hình học mới đã ra đời để đáp ứng nhu cầu mô tả các đối tượng của thế giới thực trên máy tính, đó là hình học Fractal. Hình học Fractal chính thức được biết đến thông qua bài báo nổi tiếng của Benoit Mandelbrot vào năm 1975. Bằng công cụ máy tính, ông đã khám phá ra một lĩnh vực hình học mới phản ánh thế giới một cách tự nhiên mà hình học Euclide khó có thể đáp ứng được. Vì vậy, hình học Fractal đã thu hút sự chú ý của nhiều nhà nghiên cứu và nó đã trở thành một chủ đề nóng trong giới toán học.

SỰ RA ĐỜI CỦA HÌNH HỌC FRACTAL

Cuối thế kỷ XIX đến những năm đầu của thế kỷ XX, trong nghiên cứu toán học đã xuất hiện một số tập hợp “lạ” với một số tính chất bất thường hoặc có những hình thù kỳ lạ, ngộ nghĩnh, chẳng hạn như:

· Tập Cantor: là tập con của đoạn [0,1], không chứa bất kỳ một đoạn thẳng nào nhưng vẫn có lực lượng continum.

Hình 2. Tập Cator

· Đệm Sierpinsky: tuy không có điểm trong nhưng cũng có thể ánh xạ liên tục lên toàn bộ hình vuông.

· Hình bông tuyết Von Koch: tuy chỉ chiếm một diện tích nhỏ nhưng có chu vi dài vô hạn.

Hình 3. Đệm Sierpinsky và bong tuyết Von Koch

· Hàm Weierstrass: Hàm số liên tục mà không có đạo hàm rại bất cứ điểm nào. Đồ thị của nọ là một đường cong liên tục nhưng không có đạo hàm ở bất cứ điểm nào.

Hình 4. Hàm Weierstrass

· Tập Julia: gồm những bộ phận là bản sao thu nhỏ của chính nó

Hình 5. Tập Julia với những giá trị khởi tạo khác nhau

Các tập hợp “lạ” đã gây không ít xôn xao trong giới nghiên cứu toán học và rồi chúng được chấp nhận như những trường hợp ngoại lệ của toán học.

Một số nhà vật lý như Boltzmann, Perrin sớm dự đoán được khả năng ứng dụng của các tập khác thường trong thực tế. Tuy nhiên họ cũng không thể làm gì hơn là tuyên bố chính những đường cong bất thường, gai góc như những đường cong Weierstrass mới thường hay gặp, còn các đường trơn trụ, đều đặn như đường tròn chỉ là ngoại lệ. Một số công trình đặc sắc như của F. Hausdoff và A.S.Besicovitch với những tập có thứ nguyên (số chiều) phân số cũng không có được tiếng vang trong thế giới toán học.

Năm 1975, nhà toán học người Pháp gốc Ba Lan Benoit Mandelbrot làm việc tại trung tâm nghiên cứu Thomas B. Waston của công ty IBM đã công bố công trình của mình thông qua bài báo nổi tiếng “Lý thuyết về các tập Fractal” (A Theory of Fractal Sets), sau đó là cuốn chuyên khảo “Hình học Fractal của tự nhiên” (The Fractal Geometry of Nature). Bài báo đã gây được tiếng vang lớn và được các nhà khoa học đương thời quan tâm nghiên cứu, phát triển, cuốn sách của Mandelbrot sau này đã trở thành một công trình kinh điển của hình học Fractal trong đó có một tập hợp nổi tiếng mang tên ông - tập Mandelbrot.

Hình 6. Mandelbrot và tập hợp mang tên ông

Từ đó những tập khác thường mới nhận được sự quan tâm của giới khoa học, không những trong ngành toán học mà trong hầu hết các ngành, cả tự nhiên lẫn xã hội, cả khoa học và công nghệ. Mandelbrot đặt tên cho các đối tượng khác thường này là Fractal, mượn chữ La tinh “fractus” có nghĩa là “gãy, vỡ”. Từ đây, một hướng toán học mới ra đời mang tên hình học Fractal. Môn hình học này xây dựng một khung toán học tổng quát để nghiên cứu các tập khác thường. Chỉ trong vòng vài thập kỷ, hình học Fractal đã trở thành một trong những chủ đề thời sự nóng của toán học hiện đại. Mandelbrot và các nhà toán học khác như A.Douady, J.Hubbard đã đặt nền móng và phát triển cho lý thuyết hình học Fractal. Các kết quả đạt được chủ yếu tập trung ở các tính chất của các cấu trúc Fractal cơ sở như tập Mandelbrot và tập Julia.

Dựa trên những công trình của Mandelbrot (1976, 1979, 1982) và Hutchinson (1981), vào các năm 1986, 1988 Micheal F.Barnsley và M.Begger đã phát triển lý thuyết hệ hàm lặp IFS (Iterated Function System) được ứng dụng trong nhiều lĩnh vực khác nhau.

Ngoài các công trình mang tính lý thuyết, hình học Fractal còn được bổ sung bởi những nghiên cứu ứng dụng vào trong khoa học máy tính và các ngành khoa học khác. Dựa trên lý thuyết IFS, F.Barnsley, Jacquin và một số nhà nghiên cứu khác đã phát triển phép biến đổi phân hình áp dụng cho công nghệ nén ảnh.

Hiện nay, lý thuyết phân hình đang được phát triển và nghiên cứu. Một trong những vấn đề lớn đang được quan tâm là bài toán với các độ đo phân hình (multifractal measurement) có liên quan đến sự mở rộng của khái niệm số chiều Fractal và các đối tượng Fractal trong tự nhiên, đồng thời cũng liên quan đến việc áp dụng các độ đo Fractal trong các ngành khoa học tự nhiên.

CƠ SỞ TOÁN CỦA HÌNH HỌC FRACTAL

Hình học Fractal được xây dựng trên cơ sở lý thuyết giải tích hàm, sử dụng các kiến thức về không gian Metric, không gian Hausdorff (còn được gọi là không gian Fractal)

Mandelbrot đã từng định nghĩa: “Fractal là một tập hợp có số chiều Hausdorff lớn hơn số chiều tôpô của nó”. Định nghĩa này tuy đã thâu tóm được hầu hết các tính chất của đa số các Fractal nhưng chính Mandelbrot cũng thừa nhận nó vẫn chưa thoả đáng vì đã loại trừ một số đối tượng cũng cần được coi là Fractal. Theo Kenneth Falconer thì Một tập F được gọi là Fractal nếu nó có những tính chất sau đây:

(i) F có chi tiết tại mọi tỉ lệ.

(ii) F tự tương tự.

(iii) F có số chiều Fractal lớn hơn số chiều tôpô của nó

và số chiều Fractal của F là một số không nguyên.

(iv) F thường được tạo sinh bằng một thủ tục đệ qui đơn giản.

Tuy nhiên định nghĩa này vẫn chưa đầy đủ và cho đến nay chưa ai có thể đưa ra được một định nghĩa chính xác và đầy đủ về Fractal.

Những nhà khoa học xuất sắc khác đã có nhiều đóng góp cho sự phát triển của hình học Fractal phải kể đến như Robert May làm việc tại viện nghiên cứu Princeton, Mitchell Feigenbaum làm việc tại phòng thí nghiệm Quốc gia Los Amos, Edward Lorenz làm việc tại trường Đại học Công nghệ Massachusetts và một số nhà khoa học trước đó như George Cantor, Giuseppe Peano, David Hilbert, Helge Von Koch, Gaston Julia, Pierre Fatou, Vaclaw Sierpinski. . .

CÁC ỨNG DỤNG CỦA HÌNH HỌC FRACTAL

Ứng dụng trong y học và sinh học

Các nhà khoa học đã tìm ra các mối quan hệ giữa Fractal với hình thù của tế bào, quá trình trao đổi chất của cơ thể người, ADN, nhịp tim,... Trước đây, các nhà sinh học quan niệm lượng chất trao đổi phụ thuộc vào khối lượng cơ thể người, nghĩa là nó tỉ lệ bậc 3 khi xem xét con người là một đối tượng 3 chiều. Nhưng với góc nhìn từ hình học Fractal, người ta cho rằng sẽ chính xác hơn nếu xem con người là một mặt Fractal với số chiều xấp xỉ 2.5, như vậy tỉ lệ đó không nguyên nữa mà là một số hữu tỷ.

Việc chuẩn đoán bệnh áp dụng hình học Fractal đã có những tiến bộ rõ rệt. Bằng cách quan sát hình dạng của các tế bào theo quan điểm Fractal, người ta đã tìm ra các bệnh lý của con người, tuy nhiên những lĩnh vực này vẫn còn mới mẻ, cần phải được tiếp tục nghiên cứu.

Ứng dụng trong hoá học

Hình học Fractal được sử dụng trong việc khảo sát các hợp chất cao phân tử. Tính đa dạng về cấu trúc polyme thể hiện sự phong phú về các đặc tính của hợp chất cao phân tử chính là các Fractal. Hình dáng vô định hình, đường bẻ gảy, chuỗi, sự tiếp xúc của bề mặt polyme với không khí, sự chuyển tiếp của các sol-gel,... đều có liên quan đến các Fractal.

Sự chuyển động của các phân tử, nguyên tử trong hợp chất, dung dịch, các quá trình tương tác giữa các chất với nhau,...đều có thể xem như một hệ động lực hỗn độn (chaos).

Ứng dụng trong vật lý

Trong vật lý, khi nghiên cứu các hệ cơ học có năng lượng tiêu hao (chẳng hạn như có lực ma sát) người ta cũng nhận thấy trạng thái của các hệ đó khó xác định trước được và hình ảnh hình học của chúng là các đối tượng Fractal.

Dự báo thời tiết

Hệ thống dự báo thời tiết được coi là một hệ động lực hỗn độn (chaos). Nó không có ý nghĩa dự đoán trong một thời gian dài (một tháng, một năm) do đó quy luật biến đổi của nó tuân theo qui luật Fractal.

Thiên văn học

Các nhà khoa học đã tiến hành xem xét lại các quỹ đạo của các hành tinh trong hệ mặt trời cũng như trong các hệ thiên hà khác. Một số kết quả cho thấy không phải các hành tinh này quay theo một quỹ đạo Ellipse như trong hình học Eulide mà nó chuyển động theo các đường Fractal. Quỹ đạo của nó được mô phỏng bằng những quỹ đạo trong các tập hút “lạ”.

Kinh tế

Mô tả sự biến động của giá cả trên thị trường chứng khoán bằng các đồ hình Fractal sẽ cho phép chúng ta theo dõi sự biến động của giá cả. Trên cơ sở đó dự báo giá cả trên thị trường dựa theo các luật của hình học Fractal.

Ứng dụng trong khoa học máy tính

Hình học Fractal có thể giúp thiết kế các hình ảnh đẹp trên máy tính một cách đơn giản và trực quan. Đây là một trong những lĩnh vực được nhiều người quan tâm, nhất là đối với những người yêu mến nghệ thuật [1,7,9]. Bằng chứng là triển lãm tranh mang tên “Frontiers of Chaos: Images of Complex Dynamical System” của các nhà toán học người Đức H. Jurgens, H. O. Peitgen, M. Prufer, P. H. Richter và D. Saupe đã thu hút hơn 140.000 lượt khách tới tham dự. Từ năm 1985 đến nay triển lãm tranh đã đi qua hơn 150 thành phố của hơn 30 nước trên thế giới.

Cơ sở hình học Fractal cũng đã được ứng dụng trong công nghệ nén ảnh một cách hiệu quả thông qua các hệ hàm lặp (IFS), đây là một trong những lĩnh vực được các chuyên gia về khoa học máy tính đặc biệt quan tâm.

Các lĩnh vực khác

Fractal được ứng dụng trong việc đo chiều dài đường bờ biển chính xác hơn so với hình học Eulide bởi vì đường bờ biển là một hình Fractal. Fractal còn được sử dụng để mô tả các hình ảnh nhấp nhô của đồi núi, khảo sát các vết nứt chấn động địa chấn, các sự biến đổi trong lòng đất và dự báo sự biến động của địa chất.

Trong âm nhạc hình học Fractal cũng được đưa vào ứng dụng, các điểm hút, điểm đẩy là cơ sở cấu thành các nốt nhạc Fractal...

KẾT LUẬN

Tuy chỉ mới ra đời từ năm 1975 nhưng hình học Fractal đã được ứng dụng rộng rãi trong nhiều lĩnh vực khoa học, kinh tế, xã hội. Cho đến nay, vẫn chưa có một định nghĩa chính xác và đầy đủ về hình học Fractal, tình hình này cũng giống như khái niệm xác suất trước thời Kolmogorov hoặc chương trình Langlands trước thời Ngô Bảo Châu (Năm 1967 Langlands, nhà toán học người Mỹ gốc Canada đã đề xuất mối liên hệ mật thiết giữa đại số và giải tích, cụ thể hơn là sự tương ứng giữa biểu diễn Galois và hình thức tự cấu, đó là chương trình Langlands. Năm 2008 Ngô Bảo Châu đã chứng minh được trọn vẹn Bổ đề cơ bản của chương trình Langlands). Để có được một hệ tiên đề đầy đủ, chính xác cho hình học Fractal đang là thách thức lớn đối với các nhà nghiên cứu toán học.

Thuật toán di truyền phần 2: Xây dựng chiến lược giao dịch

Trong quyết định đầu tư, mỗi nhà đầu tư có những quy tắc giao dịch riêng, một quy tắc đầu tư mà họ tin rằng có thể đem lại mức TSSL cao trên TTCK. Giá cổ phiếu vô cùng nhạy cảm với thông tin, đó có thể là thông tin về tình hình hoạt động của doanh nghiệp, về các đợt mua bán, sáp nhập, hay những thông tin vĩ mô về nền kinh tế. Mỗi nhà đầu tư tiếp nhận một khối lượng thông tin không giống nhau, phương pháp phân tích thông tin và hành động của mỗi nhà đầu tư cũng khác biệt nhau. Do đó, có vô số các quy tắc giao dịch trên thị trường và mỗi nhà đầu tư đều có một chiến lược riêng cho mình.

Quy tắc giao dịch được định nghĩa trong bài nghiên cứu là phương pháp giao dịch không đổi trong một thời gian nhất định, dựa trên cơ sở là các giá trị tới ngưỡng của các chỉ báo của một công cụ phân tích nhất định.

Bài nghiên cứu sẽ sử dụng phương pháp thuật toán di truyền, sử dụng các dữ liệu quá khứ về giá cổ phiếu để tìm ra các quy tắc giao dịch với dạng tổng quát sau:

NẾU chỉ báo thứ nhất LỚN HƠN HOẶC BẰNG (NHỎ HƠN) X₁

VÀ chỉ báo thứ hai LỚN HƠN HOẶC BẰNG (NHỎ HƠN) X₂

VÀ chỉ báo thứ ba LỚN HƠN HOẶC BẰNG (NHỎ HƠN) X₃

VÀ chỉ báo thứ tư LỚN HƠN HOẶC BẰNG (NHỎ HƠN) X₄

VÀ chỉ báo thứ năm LỚN HƠN HOẶC BẰNG (NHỎ HƠN) X₅

THÌ mua, NẾU KHÔNG THÌ bán

Trong phần tiếp theo của chương 3, bài nghiên cứu sẽ tiếp cận cụ thể hơn về các quy tắc giao dịch theo phương pháp thuật toán di truyền và một số phương pháp khác.

Quy tắc giao dịch với thuật toán di truyền

Như đã trình bày, trong bài nghiên cứu sẽ sử dụng thuật toán di truyền với các biến số đầu vào là những chỉ số phân tích kỹ thuật. Cụ thể, thuật toán di truyền sẽ được sử dụng để tìm ra các giá trị ngưỡng cho các quy tắc giao dịch như đã được trình bày ở phần 3.1. Các chỉ số PTKT được sử dụng đó là các chỉ số dao động: CCI, OSCP, RSI, %D và ROC. Sở dĩ trong bài nghiên cứu sử dụng các chỉ số trên là do kinh nghiệm từ các bài nghiên cứu trước đó của các tác giả nước ngoài như Kyung-shik Shin, Kyoung-jae Kim và Ingoo Han. Cách tích các chỉ số phân tích kỹ thuật được trình bày ở bảng dưới đây:

Phương pháp tính toán một số chỉ số PTKT

Trong đó:

C là giá đóng cửa, H là giá cao nhất, L là giá thấp nhất

MA: là đường trung bình di động của giá

Cách tính các chỉ số phụ thuộc vào số ngày được chọn để tính toán. Trong bài nghiên cứu sẽ sử dụng các chỉ số %K 14 ngày, %D là trung bình 3 kỳ của %K, CCI 14 ngày, RSI 14 ngày và ROC 20 ngày.

Trong quá trình chạy thuật toán di truyền, nguyên tắc cơ bản là tìm kiếm và thay thế các giá trị tối ưu. Kinh nghiệm chạy thuật toán trên phần mềm Evolver 5.7 cho thấy khi chạy thuật toán với các biến PTKT gốc, thuật toán sẽ không mang lại hiệu quả vì miền giá trị của các biến là khá rộng và không giống nhau. Kết quả bài toán thường chỉ xét tới tối ưu với một số biến nhất định và kết quả tối ưu hóa là chưa thuyết phục. Để khắc phục tình trạng này, bài nghiên cứu sẽ chuẩn hóa các biến đầu vào như sau:

Với những biến chuẩn hóa, bài nghiên cứu sẽ sử dụng phần mềm Evolver 5.7 chạy trên nền Excel và sử dụng một marco VBA để định nghĩa các quy tắc giao dịch. Quá trình tối ưu hóa gồm các bước sau đây:

Bước 1: Chuẩn hóa các biến PTKT.

Bước 2: Sử dụng giá trị các biến PTKT của ngày trước đó. Tìm điều kiện và giá trị tới ngưỡng của các chỉ số PTKT chuẩn hóa để tối đa hóa TSSL trong một giai đoạn cần tối ưu nhất định, giai đoạn này gọi là training period.

Bước 3: Sử dụng các kết quả tìm được trong thời gian training đầu tư trong một khoảng thời gian tiếp theo, khoảng thời gian này gọi là test period.

Bước 4: Xác định TSSL khi sử dụng kết quả của thuật toán di truyền trong khoảng thời gian đầu tư ngoài mẫu. Đánh giá kết quả.

Kết quả của quá trình tối ưu hóa trong giai đoạn training đó là các quy tắc giao dịch có dạng tổng quát như trong phần 3.1. Trong bài nghiên cứu, để đơn giản hơn về thuật toán và cấu trúc các câu lệnh, cũng như để thể hiện bản chất của vấn đề, bài nghiên cứu đưa ra một số giả định như sau:

1/ Không có chi phí giao dịch.

2/ Thời gian giao dịch là T + 0.

3/ TSSL chỉ xét đến phần lãi vốn, không xét đến cổ tức trong quá trình nắm giữ cổ phiếu.

Bài nghiên cứu sẽ sử dụng các code VBA trong Excel (code VBA sẽ được trình bày ở phần phụ lục), cách thiết kế các quy tắc giao dịch và phương pháp mã hóa dữ liệu sẽ được trình bày ở bảng dưới đây:

Cấu trúc tổng quát của quy tắc giao dịch

THÌ mua, NẾU KHÔNG THÌ bán.

Các thử nghiệm và dữ liệu nghiên cứu

Các nghiên cứu về thuật toán di truyền với các biến đầu vào là chỉ số PTKT của các tác giả nước ngoài như Flanklin Allen và Risto Karjalainen – Đại học Wharton (1995) với chỉ số S&P 500, nghiên cứu Kyung-shik Shin, Kyoung-jae Kim và Ingoo Han với chỉ số KOSPI200, nghiên cứu của Jin Li và Edward P.K. Tsang về chỉ số Dow Jones hay các nghiên cứu của Longbing Cao, Chao Luo, Jiarui Ni, Dan Luo, Chengqi Zhang về các chứng khoán trên TTCK Australia (ASX) đã cho thấy thuật toán di truyền mang lại một TSSL vượt trội so với TSSL thu được từ các phương pháp khác.

Với mục đích thử nghiệm thuật toán di truyền trên TTCK Việt Nam, bài nghiên cứu xây dựng mô hình thuật toán di truyền với cả chỉ số tổng hợp VN-index và một số chứng khoán cụ thể. Những thử nghiệm được thiết kế cụ thể như sau:

Thử nghiệm với chỉ số VN-index

Đối với chỉ số VN-index, thử nghiệm sẽ được thiết kế như sau:

Bảng 3.3 Thời gian thử nghiệm GAs với VN-index

VN-index
Training Period	Test Period
01/10/2010-30/09/2011 n = 249 ngày	03/10/2011-30/11/2011 n = 43 ngày

Quy tắc giao dịch tối ưu tìm được trong thời gian training (249 ngày) sẽ được sử dụng để đầu tư trong 2 tháng tiếp theo (43 ngày). Căn cứ để chọn mốc thời gian 2 tháng tiếp theo là do PTKT có khuynh hướng là một công cụ phân tích trong ngắn hạn, vì lẽ đó, thuật toán di truyền với các biến số là chỉ số PTKT được chuẩn hóa cũng được áp dụng trong ngắn hạn. Mặt khác, với thời gian quá ngắn, các kết quả đầu tư có thể sẽ không chính xác. Bài nghiên cứu sẽ lựa chọn test period với thời gian là 2 tháng cho cả VN-index và các các chứng khoán riêng lẻ được khảo sát.

Để làm nổi bật sự vượt trội của GAs, kết quả TSSL của thuật toán di truyền với VN-index sẽ được so sánh với TSSL từ các phương pháp sau:

§ Mô hình GARCH(p,q)

GARCH là một trong những phương pháp phổ biến nhất được sử dụng để dự báo TSSL của cổ phiếu. Mô hình GARCH(p,q) có dạng tổng quát:

Nguồn dữ liệu chứng khoán của Vn-Index được quan sát bắt đầu từ giai đoạn 01/10/2003 đến 30/09/2011. Nguồn dữ liệu này sẽ được sử dụng để dự báo TSSL trong khoảng thời gian 2 tháng 03/10/2011-30/11/2011 để so sánh TSSL với phương pháp thuật toán di truyền. Trong thời gian đó, mô hình GARCH liên tục được ước lượng lại để cập nhật dữ liệu. Tín hiệu mua, bán của GARCH được xác định như sau:

Quy tắc giao dịch với GARCH

Trong bài nghiên cứu, do giả định không có chi phí giao dịch nên

được lấy bằng 0, với hàm ý, nhà đầu tư sẽ mua vào khi có tín hiệu dương về TSSL và bán ra khi có tín hiệu âm về TSSL.

§ Lý thuyết bước đi ngẫu nhiên – Random Walk

Thuật ngữ bước đi ngẫu nhiên – radom walk được giới thiệu lần đầu tiên bởi Karl Pearson vào năm 1905. Random walk được sử dụng trong nhiều lĩnh vực khác nhau như: sinh thái học, kinh tế học, tâm lý học, khoa học máy tính, vật lý và hóa học.

Theo lý thuyết bước đi ngẫu nhiên, sự thay đổi trong giá P_t – P_t-1 được giả định là một bước ngẫu nhiên. Xét trong dài hạn, P_t – P_t-1 là bước ngẫu nhiên phân phối theo hàm phân phối chuẩn Gauss, tuy nhiên trong ngắn hạn, P_t – P_t-1 là bước ngẫu nhiên có giới hạn (giới hạn bởi sự biên độ dao động tối đa của VN-index) và không tuân theo quy luật phân phối chuẩn (theo luật số lớn). Để tạo một chuỗi ngẫu nhiên, bài nghiên cứu sử dụng code trong C++, chi tiết về việc thực hiện sẽ được trình bày ở phần phụ lục.

Trong thử nghiệm này, chỉ số VN-index cũng tương tự như giá của một cổ phiếu cụ thể. TSSL sẽ được xác định trên giá đó. Khảo sát ban đầu về ứng dụng của thuật toán di truyền với chỉ số VN-index là cơ sở để mở rộng thử nghiệm với các cổ phiếu cụ thể trên thị trường.

Thử nghiệm với các cổ phiếu cụ thể

Để chứng minh một cách cụ thể hơn hiệu quả của thuật toán di truyền, bài nghiên cứu sẽ sử dụng GAs với các cổ phiếu cụ thể. Với một số lượng lớn các cổ phiếu, việc ước lượng mô hình GARCH và tạo chuỗi ngẫu nhiên cho tất cả các cổ phiếu là một khối lượng công việc quá lớn. Trong thử nghiệm này, kết quả của thuật toán di truyền được so sánh với TSSL của phương pháp nắm giữ cổ phiếu trong cùng khoảng thời gian. Để tăng tính khách quan và khoa học, bài nghiên cứu sẽ thử nghiệm mỗi cổ phiếu ở 4 giai đoạn khác nhau.

Các giai đoạn thử nghiệm với các cổ phiếu cụ thể

Giai đoạn	Training Period	Test Period
1	04/01/2010-31/12/2010 n = 250 ngày	04/01/2011-28/02/2011 n = 34 ngày
2	01/04/2010-31/03/2011 n = 249 ngày	01/04/2011-31/05/2011 n = 39 ngày
3	01/07/2010-30/06/2011 n = 247 ngày	01/07/2011-31/08/2011 n = 45 ngày
4	01/10/2010-30/09/2011 n = 249 ngày	03/10/2011-30/11/2011 n = 43 ngày

Danh sách các cổ phiếu thử nghiệm

Mã cổ phiếu	Tên công ty cổ phần niêm yết
VIC	Công ty cổ phần Vincom
FPT	Công ty cổ phần FPT
VNM	Công ty cổ phần sữa Việt Nam -Vinamilk
MSN	Công ty cổ phần tập đoàn MaSan
BVH	Tập đoàn Bảo Việt
PNJ	Công ty cổ phần vàng bạc đá quý Phú Nhuận
PVD	Tổng công ty cổ phần khoan và dịch vụ khoan dầu khí
KDC	Công ty cổ phần Kinh Đô

Kết quả nghiên cứu

Kết quả với chỉ số VN-index

Quy tắc giao dịch tìm được với thuật toán di truyền

Với phương pháp nghiên cứu đã trình bày trong phần 3, chạy tối ưu hóa thuật toán di truyền bằng phần mềm Evolver 5.7 trên nền Excel, số lần mô phỏng là 2000 lần, cho chúng ta quy tắc giao dịch tối ưu như sau:

THÌ mua, NẾU KHÔNG THÌ bán

Trong giai đoạn thực hiện đầu tư kiểm tra ngoài mẫu, quy tắc giao dịch như trên đạt mức TSSL là -2.95 %, số ngày nắm giữ cổ phiếu là n = 3 ngày. Đây là mức TSSL âm nhưng chấp nhận được nếu chúng ta biết rằng, trong suốt giai đoạn này, với 43 ngày giao dịch, chỉ có 7 phiên là VN-index tăng điểm và VN-index trong thời gian này đã giảm tới 9.81% từ mốc (422.1 xuống chỉ còn 380.7).

Tổng hợp kết quả nghiên cứu với chỉ số VN-index

TSSL VN-index: -9.81%. n là số ngày nắm giữ cổ phiếu.

Kết quả tối ưu hóa trong mẫu (training) của các cổ phiếu

Kết quả nghiên cứu với các cổ phiếu

GIAI ĐOẠN 1 - (%)
CỔ PHIẾU	VIC	FPT	VNM	MSN	BVH	PNJ	PVD	KDC
TSSL	76.57	5.54	15.54	108.91	122.81	-9.04	-24.82	5.66
GAs	78.14	19.25	33.29	174.42	105.62	38.42	9.53	13.57
GIAI ĐOẠN 2 – (%)
CỔ PHIẾU	VIC	FPT	VNM	MSN	BVH	PNJ	PVD	KDC
TSSL	153.63	-19.41	12.27	121.62	88.21	-23.03	-10.57	-12.93
GAs	97.05	18.16	35.65	68.12	78.97	28.58	20.38	14.33
GIAI ĐOẠN 3 – (%)
CỔ PHIẾU	VIC	FPT	VNM	MSN	BVH	PNJ	PVD	KDC
TSSL	102.96	-30.47	24.22	90.20	86.46	-22.80	-17.02	-24.95
GAs	137.53	16.50	70.63	86.30	99.39	21.46	19.60	15.66
GIAI ĐOẠN 4 – (%)
CỔ PHIẾU	VIC	FPT	VNM	MSN	BVH	PNJ	PVD	KDC
TSSL	68.10	-26.62	45.51	131.37	20.75	32.44	-8.98	-31.87
GAs	131.27	13.06	69.49	139.73	96.98	82.95	49.18	31.24

Một số nhận định về kết quả nghiên cứu

Những quy tắc giao dịch tìm được bằng phương pháp chạy thuật toán di truyền bằng phần mềm Evolver 5.7 với các biến đầu vào là các chỉ số phân tích kỹ thuật đã được chuẩn hóa, với thời gian training là 1 năm, sau đó được sử dụng để đầu tư trong 2 tháng tiếp theo qua các giai đoạn thử nghiệm khác nhau. Kết quả của những thử nghiệm này đã được trình bày chi tiết trong phần 4.1 của đề tài. So sánh TSSL kiếm được từ phương pháp thuật toán di truyền với TSSL của cổ phiếu trong cùng thời kì nghiên cứu, chúng ta có thể đưa ra một số kết luận như sau:

Phương pháp thuật toán di truyền là một công cụ tiềm năng

Tổng hợp tỷ suất sinh lời của cổ phiếu qua các giai đoạn

GIAI ĐOẠN		VIC	FPT	VNM	MSN	BVH	PNJ	PVD	KDC
1	TSSL GAs	10.46	0	11.17	14.72	58.1	1.59	2.74	0
1	TSSL CP	9.56	16.69	3.19	10.67	11.02	7.05	-4.72	-2.89
2	TSSL GAs	-2.23	0	4.26	23.06	9.62	-0.78	0.87	0
2	TSSL CP	-15.26	-10.32	11.26	23.17	10.22	-17.72	-5.81	-14.85
3	TSSL GAs	0.49	7.02	9.25	10.31	0	3.81	3.47	8.6
3	TSSL CP	-13.86	15.96	15.74	10.31	-26.11	15.74	1.27	6.2
4	TSSL GAs	-2.74	0	11.58	1.69	-0.78	-0.28	1.52	0
4	TSSL CP	-14.36	-3.73	8.41	0.58	-8.59	-12.88	-3.47	-12.28
TB	TSSL GAs	1.495	1.755	9.07	12.445	16.735	1.085	2.15	2.15
TB	TSSL CP	-8.48	-3.69	9.65	11.18	-3.37	-1.95	-3.18	-5.96

Nguồn: Tác giả tổng hợp từ kết quả của phần mềm Evolver 5.7

Từ bảng kết quả tổng hợp ở bảng trên cho ta thấy phương pháp thuật toán di truyền là một phương pháp đầy triển vọng, có khả năng áp dụng vào thực tế và mang lại một tỷ suất sinh lợi khá cao so với tỷ suất sinh lợi của phương pháp mua – nắm giữ cổ phiếu trong cùng thời gian.

Năm 2011, thị trường chứng khoán Việt Nam liên tục lao dốc, chỉ số VN-index giảm từ mốc 486 điểm (04/01/2011) xuống chỉ còn 351.6 điểm (30/12/2011). Theo xu hướng chung của thị trường, đa số các cổ phiếu trong nhóm các cổ phiếu trong nhóm cổ phiếu được khảo sát trong bài nghiên cứu cũng chịu sự sụt giảm (riêng chỉ có cổ phiếu VNM và MSN là các cổ phiếu có TSSL trung bình dương qua các giai đoạn nghiên cứu). Trong sự sụt giảm chung đó, áp dụng phương pháp thuật toán di truyền mang lại hiệu quả khá cao. Cụ thể, khi áp dụng thuật toán di truyền để đầu tư, các cổ phiếu đều mang lại một TSSL trung bình dương và cao hơn, chỉ duy nhất trường hợp của VNM, GAs có TSSL thấp hơn TSSL của cổ phiếu, tuy nhiên chênh lệch này là không đáng kể (9.07% so với 9.65%). TSSL trong bài nghiên cứu được tính là TSSL trước chi phí giao dịch, do đó trên thực thế TSSL có thể thấp hơn chút ít, theo tính toán bằng Excel, chênh lệch này là từ 0.06 – 0.14 %. Trong gam màu tối của TTCK năm 2011, TSSL như trên thực sự đáng ghi nhận.

Tỷ suất sinh lợi trung bình của GAs và cổ phiếu qua các giai đoạn

Với cùng một mức TSSL, thuật toán di truyền có thể cho nhiều kết quả khác nhau về giá trị tới hạn của các chỉ số phân tích kĩ thuật chuẩn hóa. Khoảng thời gian được chọn để làm giai đoạn training cũng ảnh hưởng đến kết quả của GAs. Bài nghiên cứu chọn khoảng thời gian training là 1 năm và thời gian kiểm định là 2 tháng tiếp theo, cũng như các chỉ số PTKT như trên là do kinh nghiệm từ những bài nghiên cứu trước đó của các tác giả nước ngoài. Việc chọn khoảng thời gian phân tích và lựa chọn giá trị tới hạn thế nào là phù hợp nhất cho từng cổ phiếu trên TTCK Việt Nam vẫn là một câu hỏi khó, cần thời gian nghiên cứu lâu dài, phải được đầu tư một nền tảng công nghê thông tin ở mức độ cao và bài bản, chắc chắn trong phạm vi của đề tài chưa thể trả lời được. Khi giải quyết được những vấn đề đó, GAs sẽ thực sự phát huy được hết hiệu quả của mình và sẽ là một công cụ đáng tin cậy hơn nữa cho các nhà đầu tư.

Kết quả thuật toán di truyền trong trường hợp cổ phiếu giảm

GIAI ĐOẠN	MÃ CP	GAs (%)	TSSL CP (%)	GIAI ĐOẠN	MÃ CP	GAs (%)	TSSL CP (%)
1	FPT	0	-16.69	3	VIC	0.49	-13.86
	PVD	2.74	-4.72	3	BVH	0	-26.11
	KDC	0	-2.89	4	VIC	-2.74	-14.36
2	VIC	-2.23	-15.26		FPT	0	-3.73
	FPT	0	-10.32		BVH	-0.78	-8.59
	PNJ	-0.78	-17.72		PNJ	-0.28	-12.88
	PVD	0.87	-5.81		PVD	1.52	-3.47
	KDC	0	-14.85		KDC	0	-12.28

Nguồn: Tác giả tổng hợp từ kết quả phần mềm Evolver 5.7

Dữ liệu bảng trên cho chúng ta một kết quả ban đầu đáng ghi nhận về phương pháp GAs ở khía cạnh đối phó với những sự sụt giảm của thị trường chứng khoán. Câu hỏi được đặt ra ở đây là phải chăng GAs đã khái quát được những tín hiệu tăng, giảm giá của thị trường, do đó với những giai đoạn sụt giảm, GAs vẫn có thể thích nghi tốt và cho một kết quả khả quan? Chúng ta không thể vội kết luận như vậy bởi lẽ phạm vi nghiên cứu chỉ là những cổ phiếu có mức vốn hóa lớn, thời gian nghiên cứu cũng chỉ sử dụng dữ liệu của năm 2010 và 2011, chưa khái quát được hết sự biến động qua các giai đoạn khác nhau. Sự hạn chế về phạm vi nghiên cứu không thể cho chúng ta một kết luận chủ quan, nhưng nếu chỉ nhìn vào những kết quả ở trên, rõ ràng GAs là một công cụ mạnh để giảm thiểu mức lỗ của nhà đầu tư khi tham gia vào thị trường ở những giai đoạn giá cổ phiếu giảm, thậm chí là giảm mạnh. Đặc biệt, trong một số trường hợp, trong suốt thời gian 2 tháng đầu tư theo kết quả các giá trị tới hạn, GAs không cho chúng ta bất kì tín hiệu mua vào nào (GĐ1: FPT; GĐ2: FPT, KDC; GĐ3: BVH; GĐ4: FPT, KDC), điều này cho thấy triển vọng GAs có thể được áp dụng là một công cụ dự báo xu hướng thị trường.

Với thử nghiệm GAs cho chỉ số VN-index, GAs cũng cho kết quả thuyết phục. Khi so sánh với mô hình GARCH(1,1), hiệu quả của GAs rõ ràng là thuyết phục hơn rất nhiều. Điều này càng cho chúng ta thấy rõ hơn khả năng áp dụng GAs trong những thời kì ảm đảm của thị trường chứng khoán. Trên thực thế, nhiều quỹ đầu tư nước ngoài ở Việt Nam trong đó có VF1 đã ứng dụng GAs trong việc cắt lỗ. Đây cũng là một trong những hướng đi có thể tập trung để phát triển trong tương lai.

Quy tắc giao dịch biến đổi theo thời gian và cần sự linh hoạt khi sử dụng

Trong kinh tế, nhất là trong lĩnh vực đầu tư, không có yếu tố nào là bất biến. Trên thị trường chứng khoán, các biến số cả về vi mô và vĩ mô luôn luộn vận động và thay đổi không ngừng. Như những kết quả đã được trình bày ở phần trên, với mỗi cổ phiếu khác nhau, có sự khác biệt giữa điều kiện và các giá trị tới hạn. Đối với cùng một loại cổ phiếu, với những giai đoạn khác nhau cũng luôn có sự khác biệt giữa những giá trị này. Điều này đặt ra yêu cầu phải thật linh hoạt khi sử dụng GAs, phải có sự điều chỉnh kịp thời theo những biến động của thị trường và kết hợp GAs với các công cụ phân tích khác để có thể đưa ra những quyết định đúng đắn.

Xét trên một khía cạnh khác, vì bản thân thuật toán di truyền mô phỏng sự tiến hóa của thế giới tự nhiên, phản ánh những quy luật của thế giới tự nhiên. Mà thế giới tự nhiên luôn tiến hóa không ngừng để thích nghi, do đó các kết quả khi ứng dụng thuật toán di truyền cũng luôn thay đổi theo thời gian. Ở mỗi thời điểm nhất định, có những kiểu gen thích nghi nhất định, cũng như trên TTCK ở mỗi thời điểm có một quy tắc giao dịch nhất định mang lại TSSL vượt trội nhất.

Không có một công cụ đầu tư hoàn hảo cho tất cả nhà đầu tư

Trường hợp GAs không hiệu quả

Giai đoạn	1	2			3
Cổ phiếu	PNJ	VNM	MSN	BVH	FPT	VNM	PNJ
GAs	1.59	4.26	23.06	9.62	7.02	9.25	3.81
TSSL CP	7.05	11.26	23.17	10.22	15.96	15.74	15.74
Nắm giữ	4	14	10	17	6	30	4

Dù những phân tích và thống kê ở trên đều cho thấy GAs là một công cụ đầy triển vọng và có khả năng ứng dụng cao nhưng xét trên quan điểm tương đối, không có công cụ nào là tối ưu, có khả năng mang lại TSSL vượt trội trong tất cả mọi trường hợp. Như tổng hợp trong bảng trên, trong một số trường hợp, nhất là khi giá cổ phiếu tăng mạnh, GAs tỏ ra kém hiệu quả khi đạt TSSL kém hơn so với chiến lược mua và nắm giữ. Mỗi công cụ sẽ là công cụ tốt nhất nếu nhà đầu tư biết sử dụng một cách tốt nhất công cụ đó. Để sử dụng hiệu quả GAs, không chỉ cần nắm rõ về thuật toán, nền tảng lập trình mà cần phải có những kiến thức nhất định về TTCK. Làm thế nào để sử dụng GAs hiệu quả nhất, đó vẫn là câu hỏi làm đau đầu nhiều nhà nghiên cứu.

Những hạn chế khi ứng dụng thuật toán di truyền

Trong quá trình nghiên cứu và ứng dụng thuật toán di truyền trong việc xác định những quy tắc giao dịch hiệu quả, thuật toán di truyền tồn tại những hạn chế sau đây:

§ Thuật toán di truyền là thuật toán tối ưu hóa ngẫu nhiên, do đó kết quả cuối cùng là không xác định. Với mỗi quá trình tối ưu khác nhau, có thể có những kết quả khác nhau. Điều này khiến việc sử dụng GAs mang tính cảm quan cá nhân của người sử dụng, không có mẫu hình tối ưu chung trong tất cả các trường hợp.

§ GAs không hiệu quả trong những không gian tìm kiếm rộng và kết quả tối ưu phụ thuộc vào giá trị xác đinh ban đầu. Điều này đòi hỏi người sử dụng phải thiết kế dữ liệu một cách hợp lí. Trong bài nghiên cứu, việc chuẩn hóa dữ liệu cũng nhằm mục đích này. Các giá trị ban đầu của các chỉ số được cho là 0.5, là giá trị nằm giữa đoạn [0,1] nhằm mục đích tối ưu thời gian tìm kiếm, tuy nhiên trong nhiều trường hợp, giá trị ngưỡng không thay đổi, vẫn ở mức 0.5 khiến kết quả tối ưu chưa thật thuyết phục.

§ Ứng dụng GAs cần một kiến thức nền về lập trình và thuật toán. Vì là một thuật toán hàn lâm nên dù đã được thiết kế một cách đơn giản nhất để có thể dễ dàng ứng dụng trong lĩnh vực tài chính, tuy nhiên với nhiều nhà đầu tư, phương pháp này còn quá phức tạp. Bài nghiên cứu đã đơn giản hóa tối đa thuật toán và cấu trúc lập trình macro với mục đích để người sử dụng kết quả nghiên cứu có thể nắm được những ý tưởng cơ bản nhất, do đó phần nào làm giảm tính hiệu quả của GAs. Những rào cản về kỹ thuật áp dụng cũng là một trong những nguyên nhân khiến GAs chưa được ứng dụng một cách rộng rãi. Nhưng phải chăng đã đến lúc thay đổi tư duy phân tích và định lượng của đại bộ phận nhà đầu tư Việt Nam, phải chăng đã đến lúc ứng dụng những công cụ định lượng phức tạp hơn trong quá trình ra quyết định đầu tư?

Những hạn chế trên đây cũng sẽ là những câu hỏi nghiên cứu để phát triển đề tài trong thời gian tới.