Volume Surge Không Phải "Tín Hiệu Thần Thánh" — Data 10 Năm Nói Gì?
Sau khi chạy cohort analysis trên 10 năm backtest, kết quả khiến không ít người phải đặt lại câu hỏi: tại sao signal được hô hào nhiều nhất trong cộng đồng retail lại có edge yếu đến vậy?
Câu Chuyện Quen Thuộc Trên Mọi Group Chứng Khoán
Hầu như tuần nào cũng có một bài post kiểu này: "Cổ phiếu XYZ hôm nay volume gấp 3 lần trung bình — smart money đang gom hàng!" Đi kèm là mũi tên xanh vẽ tay trên chart, đôi khi có thêm chữ "Wyckoff accumulation" cho thêm phần hàn lâm.
Narrative này lan truyền mạnh vì nó nghe có lý. Tổ chức lớn mua thì phải có volume lớn. Volume lớn là dấu hiệu. Dấu hiệu là edge. Logic trơn tru — cho đến khi data thực tế lên tiếng.
Cohort Analysis: Định Nghĩa Trước Khi Phán
Trước tiên, cần minh bạch về cách đo. Volume surge trong bài này được định nghĩa là: volume hôm nay ≥ 2× MA20 volume. Không phải cảm tính, không phải "nhìn thấy cột nến cao bất thường".
Từ định nghĩa đó, 10 năm data được chia thành ba cohort:
- Accumulation: Volume surge + giá tăng >0.5%
- Distribution: Volume surge + giá giảm >0.5%
- Churning: Volume surge + giá đi ngang (flat)
Ba nhãn này phổ biến trong hầu hết sách kỹ thuật phân tích. Nhưng việc đặt tên một hiện tượng không đồng nghĩa với việc hiện tượng đó có predictive value cho forward return.
Con Số Thật: +0.7% Edge — Mừng Hay Buồn?
Sau khi đo forward return của cohort "volume surge >2σ so với baseline", kết quả là +0.7%.
Nghe có vẻ dương. Nhưng hãy đặt cạnh bảng so sánh đầy đủ:
| Signal | Edge (Forward Return) |
|---|---|
| Uptrend × RSI > 70 | +5.05% |
| CRISIS regime | +3.78% |
| Wyckoff stage 3 | +1.88% |
| Volume surge >2σ | +0.7% |
| MACD bullish | +0.65% |
| Volume surge alone | noise |
Volume surge đứng gần cuối bảng, chỉ nhỉnh hơn MACD bullish đúng 0.05 percentage point. Và khi volume surge được dùng độc lập, không kết hợp thêm điều kiện nào, kết quả là noise — tức là không phân biệt được với random.
Đây không phải kết quả của một thị trường hay một giai đoạn. Đây là pattern nhất quán trên 10 năm backtest.
Tại Sao Narrative Lại Mạnh Hơn Edge Thực Tế?
Có một hiện tượng khá thú vị trong cộng đồng đầu tư: "smart money" narrative phổ biến hơn realistic edge gấp nhiều lần. Không phải vì người ta ngốc — mà vì narrative dễ nhớ hơn, dễ chia sẻ hơn, và quan trọng nhất: nó xảy ra đúng đủ lần để tạo confirmation bias.
Volume surge đôi khi đúng. Đôi khi sau một phiên volume gấp 3 lần, cổ phiếu tăng mạnh tuần tiếp theo. Não người ghi nhớ những lần đó, quên đi những lần volume surge rồi giá đi ngang hoặc giảm. Kết quả là một heuristic sai được củng cố liên tục.
Data backtest không bị confirmation bias. Nó đếm tất cả các lần, kể cả những lần không ai nhắc đến.
Khi Nào Volume Surge Thực Sự Có Nghĩa?
Đây là phần quan trọng nhất, và cũng là phần bị bỏ qua nhiều nhất.
Volume surge không phải signal độc lập có edge. Nhưng khi được kết hợp với:
1. MA trend — giá đang trong uptrend rõ ràng (ví dụ giá trên MA50, MA200)
2. RSI — đặc biệt là cohort Uptrend × RSI > 70
...thì picture thay đổi hoàn toàn. Cohort Uptrend × RSI > 70 cho edge +5.05% — cao nhất trong toàn bộ bảng so sánh.
Insight này có thể diễn đạt ngắn gọn: volume surge là nhiễu khi đứng một mình, là tín hiệu xác nhận khi đứng cùng trend và momentum đúng hướng.
Điều này phù hợp với logic thị trường. Volume cao trong một uptrend mạnh phản ánh conviction — nhiều bên tham gia đang đồng thuận về hướng giá. Volume cao trong môi trường không có trend chỉ phản ánh sự bất đồng — bên mua và bên bán gần như cân bằng nhau, và kết quả là churning.
Wyckoff Và Giới Hạn Của Label
Một điểm đáng chú ý: Wyckoff stage 3 trong bảng cho edge +1.88% — cao hơn volume surge đơn thuần đáng kể. Điều này gợi ý rằng framework Wyckoff có giá trị khi được áp dụng đúng giai đoạn, không phải khi bị đơn giản hóa thành "volume cao = accumulation".
Tuy nhiên, cũng cần thẳng thắn: +1.88% vẫn thấp hơn nhiều so với combo Uptrend × RSI > 70. Framework phức tạp không tự động cho edge cao hơn.
3 Takeaway Từ Cohort Analysis Này
1. Volume surge ≠ edge độc lập.
Data 10 năm xác nhận: dùng volume surge một mình để ra quyết định tương đương với noise. Forward return không phân biệt được với random.
2. Context quyết định tất cả.
Cùng một tín hiệu volume, trong uptrend mạnh với RSI xác nhận, edge nhảy từ +0.7% lên vùng +5%. Bộ lọc trend + momentum là layer không thể thiếu.
3. Narrative phổ biến ≠ edge thực tế.
"Smart money đang gom" là câu chuyện hay. Nhưng data không quan tâm đến câu chuyện — nó chỉ đo return. Khoảng cách giữa narrative và edge thực tế là nơi nhiều tài khoản bị tổn thất.
Verify Reproducible 🔍
Toàn bộ cohort analysis này được build trên pipeline của Lotus AI. Nếu muốn tự verify hoặc chạy thử trên data khác:
pip install lotusmarket pandas numpy
import lotusmarket as lm
# Load cohort volume surge
df = lm.cohort.volume_surge(threshold=2.0, ma_window=20)
print(df.groupby("label")["fwd_return_20d"].describe())
# Kết hợp với MA trend filter
df_filtered = df[df["above_ma50"] == True]
print(df_filtered.groupby("rsi_bucket")["fwd_return_20d"].mean())
Source và documentation đầy đủ tại github.com/ducnhd/lotusmarket.
Disclaimer: Bài viết chỉ mang tính phân tích kỹ thuật và giáo dục, không phải lời khuyên đầu tư. Mọi quyết định giao dịch đều thuộc trách nhiệm cá nhân.
Thích bài này? ⭐ Star repo · 💬 Subscribe Telegram để nhận daily report · 📡 RSS feed