Tổng quan về mạng nơ ron nhân tạo

Tổng quan về mạng nơ ron nhân tạo từ những đặc trưng đến các thành phần cơ bản,… của mạng nơ ron nhân tạo. Tất cả được tổng hợp qua bài viết sau đây, hãy cùng theo dõi nha.

1. Mạng nơ ron nhân tạo là gì?

Mạng nơ ron nhân tạo là gì?

Mạng nơ ron nhân tạo hay còn được gọi với tên Neural Network, đây là một chuỗi những thuật toán được đưa ra để tìm kiếm các mối quan hệ cơ bản trong tập hợp các dữ liệu. Thông qua việc bắt bước cách thức hoạt động từ não bộ con người.

Hay nói một cách khác, mạng nơ ron nhân tạo được xem là hệ thống của các tế bào thần kinh nhân tạo, đây thường có thể là hữu cơ hoặc nhân tạo về bản chất.

Nó gồm có một nhóm các neural nhân tạo (nút) nối với nhau, và xử lý thông tin bằng cách truyền theo các kết nối và tính giá trị mới tại các nút (cách tiếp cận connectionism đối với tính toán).

Trong nhiều trường hợp, mạng neural nhân tạo là một hệ thống thích ứng (adaptive system) tự thay đổi cấu trúc của mình dựa trên các thông tin bên ngoài hay bên trong chảy qua mạng trong quá trình học.

Trong thực tế sử dụng, nhiều mạng neural là các công cụ mô hình hóa dữ liệu thống kê phi tuyến. Chúng có thể được dùng để mô hình hóa các mối quan hệ phức tạp giữa dữ liệu vào và kết quả hoặc để tìm kiếm các dạng/mẫu trong dữ liệu.

2. Các đặc trưng cơ bản của mạng nơ ron nhân tạo

ác đặc trưng cơ bản của mạng nơ ron nhân tạo

  • Gồm một tập các đơn vị xử lý (các noron nhân tạo)
  • Trạng thái kích hoạt hay đầu ra của đơn vị xử lý
  • Liên kết giữa các đơn vị. Xét tổng quát, mỗi liên kết được định nghĩa bởi một trọng số Wjk cho ta biết hiệu ứng mà tín hiệu của đơn vị j có trên đơn vị k
  • Một luật lan truyền quyết định cách tính tín hiệu ra của từng đơn vị từ đầu vào của nó
  • Một hàm kích hoạt, hay hàm chuyển (activation function, transfer function), xác định mức độ kích hoạt khác dựa trên mức độ kích hoạt hiện tại
  • Một đơn vị điều chỉnh (độ lệch) (bias, offset) của mỗi đơn vị
  • Phương pháp thu thập thông tin (luật học – learning rule)
  • Môi trường hệ thống có thể hoạt động.

3. Các thành phần cơ bản của mạng nơ ron nhân tạo

Đơn vị xử lý

Đơn vị xử lý

Hay còn được gọi là một nơ ron hay một node, chúng thực hiện công việc đơn giản là nhận tín hiệu từ các đơn vị phía trước hay nguồn bên ngoài và sử dụng chúng để tính tín hiệu ra sẽ được lan truyền sang các đơn vị khác.

Quan sát hình, trong đó:

  • xi : các đầu vào
  • wji : các trọng số tương ứng với các đầu vào.
  • θj : độ lệch bias
  • aj: đầu vào mạng net-input
  • zj: đầu ra của nơ ron
  • g (x): hàm chuyển (hàm kích hoạt)

Trong một mạng nơ ron sẽ có 3 kiểu đơn vị

  • Tầng input layer (tầng vào): Tầng này nằm bên trái cùng của mạng, thể hiện cho các đầu vào của mạng.
  • Tầng output layer (tầng ra): Là tầng bên phải cùng và nó thể hiện cho những đầu ra của mạng.
  • Tầng hidden layer (tầng ẩn): Tầng này nằm giữa tầng vào và tầng ra nó thể hiện cho quá trình suy luận logic của mạng.

Mỗi đơn vị j có thể có một hoặc nhiều đầu vào: x0, x1, x2, … xn, nhưng chỉ có một đầu ra zj. Một đầu vào tới một đơn vị có thể là dữ liệu từ bên ngoài mạng, hoặc đầu ra của một đơn vị khác, hoặc là đầu ra của chính nó.

Hàm kết hợp

Mỗi một đơn vị trong một mạng kết hợp các giá trị đưa vào nó thông qua các liên kết với các đơn vị khác, sinh ra một giá trị gọi là net input. Hàm thực hiện nhiệm vụ này được gọi là hàm kết hợp – combination function, được định nghĩa bởi một luật lan truyền cụ thể.

Trong phần lớn các mạng nơ ron, chúng ta giả sử rằng mỗi một đơn vị cung cấp một bộ cộng như là đầu vào cho đơn vị mà nó có liên kết. Tổng đầu vào đơn vị j đơn giản chỉ là tổng trọng số của các đầu ra riêng lẻ từ các đơn vị kết nối cộng thêm ngưỡng hay độ lệch (bias) θj :

Hàm kết hợp

Trường hợp wji > 0, nơron được coi là đang ở trong trạng thái kích thích. Tương tự, nếu như wji < 0, nơron ở trạng thái kiềm chế. Chúng ta gọi các đơn vị với luật lan truyền như trên là các sigma units.

Trong một vài trường hợp người ta cũng có thể sử dụng các luật lan truyền phức tạp hơn. Một trong số đó là luật sigma-pi, có dạng như sau:

Rất nhiều hàm kết hợp sử dụng một “độ lệch” hay “ngưỡng” để tính net input tới đơn vị. Đối với một đơn vị đầu ra tuyến tính, thông thường, θj được chọn là hằng số và trong bài toán xấp xỉ đa thức θj = 1.

Hàm kích hoạt

Phần lớn các đơn vị trong mạng nơron chuyển net input bằng cách sử dụng một hàm vô hướng (scalar-to-scalar function) gọi là hàm kích hoạt, kết quả của hàm này là một giá trị gọi là mức độ kích hoạt của đơn vị (unit’s activation).

Loại trừ khả năng đơn vị đó thuộc lớp ra, giá trị kích hoạt được đưa vào một hay nhiều đơn vị khác. Các hàm kích hoạt thường bị ép vào một khoảng giá trị xác định, do đó thường được gọi là các hàm bẹp (squashing). Các hàm kích hoạt hay được sử dụng là:

Hàm đồng nhất (Linear function, Identity function)

Nếu coi các đầu vào là một đơn vị thì chúng sẽ sử dụng hàm này. Đôi khi một hằng số được nhân với net-input để tạo ra một hàm đồng nhất.

Hàm bước nhị phân (Binary step function, Hard limit function)

Hàm này cũng được biết đến với tên “Hàm ngưỡng” (Threshold function hay Heaviside function). Đầu ra của hàm này được giới hạn vào một trong hai giá trị:

Hàm bước nhị phân (Binary step function, Hard limit function)

Dạng hàm này được sử dụng trong các mạng chỉ có một lớp. Trong hình vẽ sau, θ được chọn bằng 1.

Hàm sigmoid (Sigmoid function (logsig))

Hàm sigmoid (Sigmoid function (logsig))

Hàm này đặc biệt thuận lợi khi sử dụng cho các mạng được huấn luyện (trained) bởi thuật toán Lan truyền ngược (back-propagation), bởi vì nó dễ lấy đạo hàm, do đó có thể giảm đáng kể tính toán trong quá trình huấn luyện.

Hàm này được ứng dụng cho các chương trình ứng dụng mà các đầu ra mong muốn rơi vào khoảng [0,1]

Hàm sigmoid lưỡng cực (Bipolar sigmoid function)

Hàm sigmoid lưỡng cực (Bipolar sigmoid function)

Hàm này có các thuộc tính tương tự hàm sigmoid. Nó làm việc tốt đối với các ứng dụng có đầu ra yêu cầu trong khoảng [-1,1].

4. Các hình trạng của mạng

Hình trạng của mạng được định nghĩa bởi số lớp (layers), số đơn vị trên mỗi lớp, sự liên kết giữa các lớp. Các mạng về tổng thể được chia thành hai loại dựa trên cách thức liên kết các đơn vị.

Mạng truyền thẳng (Feed-forward neural network)

Mạng truyền thẳng (Feed-forward neural network)

Dòng dữ liệu từ đơn vị đầu vào đến đơn vị đầu ra chỉ được truyền thẳng, việc xử lý dữ liệu có thể mở rộng ra nhiều lớp nhưng không có các liên kết phản hồi.

Nghĩa là, các liên kết mở rộng từ các đơn vị đầu ra tới các đơn vị đầu vào trong cùng một lớp hay các lớp trước đó là không cho phép.

Mạng hồi quy (Recurrent neural network)

Mạng hồi quy (Recurrent neural network)

Có chứa các liên kết ngược. Khác với mạng truyền thẳng, các thuộc tính động của mạng mới quan trọng. Trong một số trường hợp, các giá trị kích hoạt của các đơn vị trải qua quá trình nới lỏng (tăng giảm số đơn vị và thay đổi các liên kết) cho đến khi mạng đạt đến một trạng thái ổn định và các giá trị kích hoạt không thay đổi nữa.

Trong các ứng dụng khác mà cách chạy động tạo thành đầu ra của mạng thì những sự thay đổi các giá trị kích hoạt là đáng quan tâm.

5. Ứng dụng của mạng nơ ron nhân tạo

Ứng dụng của mạng nơ ron nhân tạo

Mạng nơ ron nhân tạo được ứng dụng cho rất nhiều lĩnh vực như: tài chính, giao dịch, phân tích kinh doanh, lập kế hoạch cho doanh nghiệp và bảo trì sản phẩm.

Neural Network còn được sử dụng khá rộng rãi cho những hoạt động kinh doanh khác như: dự báo thời tiết, và tìm kiếm các giải pháp nhằm nghiên cứu tiếp thị, đánh giá rủi ro và phát hiện gian lận.

Nhiều trường hợp còn sử dụng mạng nơ ron nhân tạo để thực hiện đánh giá và khai quật những cơ hội giao dịch dựa vào việc phân tích dữ liệu lịch sử. Mạng nơron còn được áp dụng rất phổ biến để phân biệt sự phụ thuộc giữa các phi tuyến lẫn nhau của đầu vào.

Đây là vấn đề mà các mô hình phân tích kỹ thuật khác không thể đáp ứng được. Dù vậy, sự chính xác của việc áp dụng mạng nơron nhân tạo vào dự đoán giá cổ phiếu hoàn toàn khác nhau.

>>> Xem thêm: Ngôn ngữ lập trình Python là gì?

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *