12 Thuật Toán Tối Ưu Hóa Danh Mục Đầu Tư, So Sánh: HRP, Black-Litterman, NCO và Hơn Thế Nữa

Mỗi bộ tối ưu hóa danh mục đều trả lời cùng một câu hỏi: cho trước lịch sử giá của một tập hợp tài sản, cần phân bổ bao nhiêu phần vốn vào mỗi tài sản? Vấn đề là không có một câu trả lời duy nhất đúng — chỉ có một họ các câu trả lời, mỗi câu trả lời là sản phẩm của một giả định khác nhau về cách thị trường hoạt động và mức độ bạn tin tưởng vào các ước lượng của chính mình.

Vì vậy, thay vì đặt cược vào một phương pháp, chúng tôi đã xây dựng một công cụ chạy mười hai phương pháp song song, tất cả thông qua một giao diện duy nhất, và để bạn quan sát chúng bất đồng trên dữ liệu thực. Công cụ này là mã nguồn mở, được viết bằng Rust, và hoạt động tại portfolio-optimizer.marketmaker.cc. Bài viết này là bản đồ: mỗi thuật toán tin vào điều gì, toán học đến từ đâu, và điều gì xảy ra khi bạn trỏ cả mười hai vào cùng một rổ tiền mã hóa.

Một giao diện, mười hai quan điểm

Mỗi thuật toán trong dự án đều có cùng chữ ký hàm:

pub fn optimize(prices: &[Vec<f64>]) -> Vec<f64>

Đầu vào là giá, đầu ra là trọng số. Các trọng số chỉ có giá trị dương (long-only), không âm, và tổng bằng 1.0. Sự đồng nhất đó chính là mục tiêu — nó có nghĩa là bạn có thể thay thế Hierarchical Risk Parity bằng Mean-Variance Optimization mà không cần thay đổi một dòng code nào trong phần gọi, và bạn có thể đánh giá tất cả chúng trên đầu vào giống hệt nhau. Mỗi thuật toán nằm trong crate riêng của nó (portfolio-hrp, portfolio-mvo, portfolio-nco, …) để bạn có thể phụ thuộc vào đúng cái bạn cần.

Bên trong, chúng hoàn toàn khác nhau. Hãy cùng đi qua các họ thuật toán.

Phương pháp cổ điển: Tối Ưu Hóa Trung Bình-Phương Sai (MVO)

Đây là nơi lý thuyết danh mục hiện đại bắt đầu — Harry Markowitz, 1952. MVO coi việc phân bổ như một bài toán tối ưu có ràng buộc: tối đa hóa lợi nhuận kỳ vọng cho một mức rủi ro nhất định. Hình thức, bạn giải

$\max_{w} \quad w^\top \mu - \frac{\gamma}{2}\, w^\top \Sigma w$

$\text{s.t.} \quad \sum_i w_i = 1, \quad w_i \ge 0$

trong đó $\mu$ là vector lợi nhuận kỳ vọng, $\Sigma$ là ma trận hiệp phương sai, và $\gamma$ là mức độ né tránh rủi ro của bạn. Khi các đầu vào tốt, MVO không thể bị đánh bại: theo cấu trúc, đây là đường biên hiệu quả.

Vấn đề là các đầu vào không bao giờ tốt. Lợi nhuận kỳ vọng $\mu$ được ước lượng từ lịch sử nhiễu, và MVO cực kỳ nhạy cảm với chúng — một thay đổi nhỏ trong ước lượng có thể làm phân bổ chuyển từ 80% vào một tài sản sang 80% vào tài sản khác. Các nhà thực hành gọi đây là "tối đa hóa sai số": bộ tối ưu hóa vui vẻ đổ vốn vào bất kỳ tài sản nào có lợi nhuận bị ước lượng quá cao nhất. MVO là điểm chuẩn mà mọi người đo lường và câu chuyện cảnh báo mà mọi người trích dẫn.

Họ phân cấp: HRP, HERC, GHRP, MHRP

Năm 2016, Marcos López de Prado đề xuất một ý tưởng khác: không đảo ngược ma trận hiệp phương sai chút nào. Hierarchical Risk Parity (HRP) tránh sự không ổn định của MVO bằng cách không giải trực tiếp bài toán tối ưu. Nó hoạt động theo ba giai đoạn:

Phân cụm theo cây — chuyển đổi ma trận tương quan thành một số đo khoảng cách, $d_{ij} = \sqrt{\tfrac{1}{2}(1 - \rho_{ij})}$ , và xây dựng một hệ thống phân cấp của các tài sản sao cho các tài sản tương tự nằm trên cùng một nhánh.
Chuẩn hóa quasi-diagonal — sắp xếp lại ma trận hiệp phương sai sao cho các tài sản tương quan liền kề nhau, tập trung các giá trị lớn dọc theo đường chéo.
Chia đôi đệ quy — tách cây từ trên xuống, phân bổ vốn giữa hai nửa theo tỷ lệ nghịch với phương sai của chúng.

Kết quả là một danh mục tôn trọng cấu trúc của thị trường — các tài sản tương quan cạnh tranh với nhau về trọng số, không phải với tất cả cùng một lúc. HRP ổn định hơn đáng kể so với MVO ngoài mẫu chính xác vì nó không bao giờ đảo ngược một ma trận điều kiện kém.

Dự án cung cấp bốn thành viên của họ này:

HRP — thuật toán gốc của López de Prado.
HERC (Hierarchical Equal Risk Contribution) — thay thế phân chia nghịch đảo-phương sai bằng quy tắc đóng góp rủi ro bằng nhau tại mỗi nút, sao cho mỗi cụm đóng góp bằng nhau vào tổng rủi ro.
GHRP (Generalized HRP) — một tổng quát hóa có tham số cho phép bạn điều chỉnh các bước phân cụm và phân bổ.
MHRP (Modified HRP) — một biến thể điều chỉnh trọng số chia đôi cho các phân phối lợi nhuận có đuôi nặng hơn.

Chúng là những người họ hàng gần, nhưng trên dữ liệu thực chúng phân kỳ đáng kể — đó chính xác là lý do tại sao có cả bốn lại hữu ích.

Tích hợp quan điểm: Black-Litterman

Mô hình Black-Litterman (Goldman Sachs, thập niên 1990) được xây dựng để sửa lỗi thực tế nhất của MVO: nó buộc bạn phải cung cấp lợi nhuận kỳ vọng cho mọi tài sản, kể cả những tài sản bạn không có ý kiến gì. Black-Litterman thay vào đó bắt đầu từ một cân bằng thị trường ngụ ý trung lập và cho phép bạn kết hợp các quan điểm của mình, được tính trọng số theo mức độ tin tưởng của bạn.

$E[R] = \big[(\tau\Sigma)^{-1} + P^\top \Omega^{-1} P\big]^{-1} \big[(\tau\Sigma)^{-1}\Pi + P^\top \Omega^{-1} Q\big]$

Ở đây $\Pi$ là lợi nhuận cân bằng, $P$ và $Q$ mã hóa quan điểm của bạn ("tài sản A sẽ vượt trội tài sản B 2%"), và $\Omega$ là sự không chắc chắn của những quan điểm đó. Khi bạn không có quan điểm nào, nó thu về danh mục thị trường; khi bạn chắc chắn, nó nghiêng mạnh về phía cược của bạn. Đây là phương pháp nhận thức quan điểm nhất trong mười hai.

Phương pháp lai: Tối Ưu Hóa Phân Cụm Lồng Nhau (NCO)

NCO, cũng từ López de Prado, là sự kết hợp khéo léo giữa hai thế giới trên. Nó phân cụm tài sản như HRP, sau đó chạy Tối Ưu Hóa Trung Bình-Phương Sai nhỏ, điều kiện tốt bên trong mỗi cụm và một lần nữa giữa các cụm. Bằng cách chỉ đảo ngược các ma trận con nhỏ, ổn định, NCO nắm bắt tính tối ưu của MVO khi an toàn để sử dụng, trong khi tránh sự không ổn định của việc đảo ngược một ma trận hiệp phương sai lớn duy nhất. Đây thường là phương pháp thể hiện tốt nhất của cả hai.

Phần còn lại của danh sách

Entropy Pooling (Meucci) — một khung xác suất tìm phân phối gần nhất với tiên nghiệm của bạn nhất (theo entropy tương đối) trong khi thỏa mãn một tập hợp quan điểm như ràng buộc. Tinh tế khi bạn muốn diễn đạt sự không chắc chắn hơn là các dự báo điểm.
OLPS (Online Portfolio Selection) — một họ chiến lược tuần tự (danh mục phổ quát, follow-the-winner, mean-reversion) tái cân bằng khi giá mới đến, với các giới hạn hối tiếc có thể chứng minh được. Phương pháp trực tuyến thực sự duy nhất trong tập hợp.
RBA (Robust Bayesian Allocation) — bọc việc phân bổ trong một lớp co rút Bayesian, kéo các ước lượng nhiễu về phía tiên nghiệm hợp lý sao cho một tháng kỳ lạ không thể chi phối các trọng số.
TIC (Theory-Implied Correlation) — thay thế ma trận tương quan mẫu thô bằng ma trận đã được khử nhiễu dựa trên cấu trúc lý thuyết (thường là phân loại kinh tế), có thể cải thiện đáng kể các phương pháp phân cấp phụ thuộc vào tương quan.
Pipeline — thuật toán "nhà" tổng hợp của chúng tôi: một xương sống HRP với lớp phủ long/short tùy chọn và một ràng buộc CVaR (rủi ro đuôi). Thông qua điểm vào optimize() long-only đồng nhất, nó hoạt động như HRP; bộ máy long/short và rủi ro đuôi của nó hoạt động khi bạn điều khiển nó bằng các tín hiệu rõ ràng. Chúng tôi phân tích đầy đủ trong bài viết chuyên sâu: Bên Trong Thuật Toán Nhà Của Chúng Tôi: HRP + Long/Short + CVaR với Hull-White.

Điều gì xảy ra khi bạn chạy đua cả mười hai

Đây là phần thú vị. Chúng tôi trỏ cả mười hai vào một rổ hỗn hợp được thiết kế cẩn thận — ba người chiến thắng mạnh mẽ (ZEC, Tether Gold, 1000RATS) và ba kẻ thua lỗ nặng (FLOW, KAVA, LINEA) — trong cửa sổ từ tháng 9 năm 2025 đến tháng 2 năm 2026, và để mỗi thuật toán phân bổ.

Thuật toán	Lợi nhuận hàng năm	Sharpe
RBA	+149%	—
MVO	+74%	2.52
Entropy Pooling	+57%	1.93
NCO	+44%	—
HERC	+30%	—
Black-Litterman	+7%	—
OLPS	−74%	—
MHRP	−78%	—
GHRP	−95%	—
HRP / Pipeline	−103%	−2.45
TIC	−131%	—

Một lưu ý quan trọng trước khi bạn đọc bất cứ điều gì từ đây: những con số này đến từ một rổ trong một cửa sổ, và rổ được thiết kế cố tình chứa những người chiến thắng và kẻ thua lỗ cực đoan. Đây không phải là tuyên bố hiệu suất và hoàn toàn không phải lời khuyên — đây là minh họa về sự phân kỳ hành vi. Chạy trên tài sản của bạn và thứ hạng sẽ hoàn toàn thay đổi.

Nhưng hình dạng của kết quả mới là bài học. Các phương pháp tìm kiếm lợi nhuận — MVO, RBA, Entropy Pooling, NCO — tập trung vốn vào những người chiến thắng và đạt lợi nhuận dương mạnh. Các phương pháp rủi ro ngang bằng thuần túy — HRP, TIC, MHRP, GHRP — phân bổ trọng số đều đặn vì mục đích đa dạng hóa, điều này có nghĩa là cũng nắm giữ những kẻ thua lỗ, và đi vào âm. Không có hành vi nào là "sai". Rủi ro ngang bằng được xây dựng để tồn tại khi bạn không thể phân biệt người chiến thắng với kẻ thua lỗ trước; trên một rổ mà tương lai được thiết kế để có thể biết được, nó phải trả giá cho sự khiêm tốn của mình. Sự căng thẳng đó — tập trung so với đa dạng hóa, niềm tin so với sự vững chắc — là toàn bộ lĩnh vực trong một bảng.

Mã nguồn mở và trực tiếp

Toàn bộ đều mở: mười hai Rust algorithm crates dưới dạng git submodules, một Axum HTTP backend điều phối tất cả chúng, và một front end Next.js với biểu đồ đường biên hiệu quả tương tác và bảng so sánh song song. Bạn có thể:

dùng thử trực tiếp tại portfolio-optimizer.marketmaker.cc — chọn tài sản, khoảng thời gian và thuật toán, và xem các trọng số và đường biên cập nhật;
mở tab Compare Methods để chạy cả mười hai trên các giá giống nhau cùng một lúc;
phụ thuộc vào bất kỳ crate đơn lẻ nào (portfolio-hrp, portfolio-nco, …) trong dự án Rust của bạn.

Điểm rút ra

Không có bộ tối ưu hóa tốt nhất phổ quát. Lựa chọn đúng phụ thuộc vào mức độ bạn tin tưởng vào các ước lượng lợi nhuận của mình. Tin tưởng → MVO/Black-Litterman. Không tin tưởng → HRP và những người bạn.
MVO là tối ưu và mỏng manh. Nó định nghĩa đường biên hiệu quả nhưng tối đa hóa sai số ước lượng. Hãy đối xử với các trọng số của nó với sự nghi ngờ trừ khi đầu vào của bạn thực sự đáng tin cậy.
Các phương pháp phân cấp đánh đổi hiệu suất đỉnh để đổi lấy sự ổn định. Chúng hiếm khi đứng đầu một backtest đơn lẻ nhưng cũng hiếm khi sụp đổ — đó là điều thực sự quan trọng khi tương lai là không xác định.
Một giao diện đồng nhất là siêu năng lực. Một khi mỗi thuật toán là prices -> weights, việc so sánh chúng trung thực không tốn gì, và việc chuyển đổi là miễn phí.

Cách tốt nhất để hiểu mười hai thuật toán là xem chúng tranh luận. Hãy chạy so sánh trên các tài sản bạn thực sự quan tâm.

Tài liệu tham khảo

Markowitz, H. (1952). Portfolio Selection. The Journal of Finance.
López de Prado, M. (2016). Building Diversified Portfolios that Outperform Out of Sample. The Journal of Portfolio Management.
López de Prado, M. (2020). Machine Learning for Asset Managers. Cambridge University Press.
Black, F., & Litterman, R. (1992). Global Portfolio Optimization. Financial Analysts Journal.
Meucci, A. (2008). Fully Flexible Views: Theory and Practice. Risk.
Marketmaker.cc: marketmaker.cc

Trích dẫn

@article{soloviov2026portfoliooptimization,
  author = {Soloviov, Eugen and Zhuravleva, Marina and Kiselev, Kirill},
  title = {12 Portfolio Optimization Algorithms, Compared: HRP, Black-Litterman, NCO and Beyond},
  year = {2026},
  url = {https://marketmaker.cc/vi/blog/post/portfolio-optimization-algorithms-compared},
  description = {Hành trình qua mười hai thuật toán phân bổ danh mục — MVO, họ phân cấp (HRP, HERC, GHRP, MHRP), Black-Litterman, NCO, Entropy Pooling, OLPS, RBA, TIC và một pipeline tổng hợp — thông qua một giao diện Rust duy nhất, với một bài so sánh song song trung thực trên một rổ tiền mã hóa hỗn hợp.}
}

12 Thuật Toán Tối Ưu Hóa Danh Mục Đầu Tư, So Sánh: HRP, Black-Litterman, NCO và Hơn Thế Nữa

Một giao diện, mười hai quan điểm

Phương pháp cổ điển: Tối Ưu Hóa Trung Bình-Phương Sai (MVO)

Họ phân cấp: HRP, HERC, GHRP, MHRP

Tích hợp quan điểm: Black-Litterman

Phương pháp lai: Tối Ưu Hóa Phân Cụm Lồng Nhau (NCO)

Phần còn lại của danh sách

Điều gì xảy ra khi bạn chạy đua cả mười hai

Mã nguồn mở và trực tiếp

Điểm rút ra

Tài liệu tham khảo

Trích dẫn

Tác Giả

Đọc Thêm

Bên Trong Thuật Toán Nội Bộ: HRP + Long/Short + CVaR với Hull-White

Lý thuyết danh mục đầu tư Markowitz cho Crypto: Từ Cơ Bản đến Nâng Cao

Thực Thi Arbitrage Phức Tạp trong Rust: Từ Nanosecond đến Đa Chân Nguyên Tử

Một giao diện, mười hai quan điểm

Phương pháp cổ điển: Tối Ưu Hóa Trung Bình-Phương Sai (MVO)

Họ phân cấp: HRP, HERC, GHRP, MHRP

Tích hợp quan điểm: Black-Litterman

Phương pháp lai: Tối Ưu Hóa Phân Cụm Lồng Nhau (NCO)

Phần còn lại của danh sách

Điều gì xảy ra khi bạn chạy đua cả mười hai

Mã nguồn mở và trực tiếp

Điểm rút ra

Tài liệu tham khảo

Trích dẫn

Tác Giả

Đọc Thêm

Bên Trong Thuật Toán Nội Bộ: HRP + Long/Short + CVaR với Hull-White

Lý thuyết danh mục đầu tư Markowitz cho Crypto: Từ Cơ Bản đến Nâng Cao

Thực Thi Arbitrage Phức Tạp trong Rust: Từ Nanosecond đến Đa Chân Nguyên Tử

Đi Trước Thị Trường

Thành công!

Sign In