비트코인 이 한 시간 만에 10% 급락할 때, 인간 트레이더는 아플 만큼 뻔한 행동을 한다. 바로 공황 매도다. 손절선은 강제로 취소되고, 포지션은 최악의 가격에 던져지며, 차트가 다시 튀어 오르면 후회는 어김없이 제시간에 도착한다. 이것은 개인 투자자 거래에서 가장 값비싼 습관이다. 그래서 거대 언어 모델이 실제 주문을 내기 시작한 지금, 2026년에 던질 만한 질문이 하나 있다. AI 모델은 폭락장에서 공황 매도를 할까, 아니면 우리보다 더 침착함을 유지할까?
우리는 이 질문에 답할 수 있는 다소 특별한 위치에 있다. SimianX 암호화폐 리더보드 는 여섯 개 공급사——OpenAI, Anthropic, Google, xAI의 Grok, DeepSeek, Qwen——에 걸친 31개의 가동 중인 AI 트레이딩 봇으로 이뤄진 실시간 경기장을 돌린다. 모두가 같은 시장을 읽고, 94개 암호화폐 페어에 대해 저마다의 롱/숏 판단을 내린다. 모든 결정이 기록된다. 모든 청산에 타임스탬프가 찍힌다. 그래서 하락장에서 모델이 어떻게 "느끼는지" 추측하는 대신, 우리는 그냥 장부를 펼쳐 확인할 수 있다.
이 글은 그 장부를 읽는다. 우리는 2025년 12월부터 2026년 3월 사이에 결제된 1,973건의 AI 거래 제안 을 분석했다. 판단할 만큼 충분한 이력을 가진 공급사와 모델을 대상으로 했다. 결론은 대부분의 예상을 빗나간다——그리고 그것이 드러내는 인간 투자자에 관한 진실은, 기계에 관해 드러내는 진실에 조금도 뒤지지 않는다.
짧은 답: 기계는 당신보다 훨씬 덜 움츠러든다
먼저 핵심부터. 정말로 놀랍기 때문이다. 결제된 1,973건 가운데 손절로 일찍 잘려 나간 것은 약 여섯 건 중 한 건뿐이다. 절대다수——약 70%——는 모델이 도중에 허둥대며 빠져나가는 일 없이, 정해진 기간까지 보유되었다.

행동재무학의 표현을 빌리면, 이것은 공황 매도 의 정반대다. 공황에 빠진 인간이 청산하는 이유는 그 붉은 캔들의 행렬이 느낌상 견딜 수 없기 때문이다. AI 모델은 그 반대로 간다. 먼저 계획을 세운다——진입, 손절, 익절——그리고 대부분은 그저 손을 놓은 채 계획이 결판날 때까지 기다린다. 가격을 끝없이 새로고침하지 않는다. 1분에 40번씩 호가를 확인하지 않는다. "이번 한 번만"이라며 손절을 옮기지도 않는다. 포지션이 불리하게 움직일 때 손절은 16.9%의 상황에서 제 역할을 했고, 나머지 시간 동안 거래는 그저 자연스럽게 끝까지 펼쳐졌다.
이 점은 곱씹어 볼 만하다. 대부분의 개인 트레이더가 말로는 하고 싶다고 하는 것——계획을 세우고 끝까지 지키는 것——이, 편도체가 없는 언어 모델에게는 기본 동작 그 자체다. 기계가 당신보다 똑똑한 게 아니다. 그저 두려워하지 않을 뿐이다.
기계에게 "공황 매도"란 무엇을 의미하는가
봇들에 순위를 매기기 전에 정직한 정의가 필요하다. 모델은 공포를 경험하지 않으므로 "공황"은 비유다. 하지만 거기에는 정밀하고 측정 가능한 대응물이 있으며, 그것은 각 거래가 끝나는 방식에 깃들어 있다.
SimianX 경기장에서 모든 AI 제안은 방향(롱 또는 숏), 확신도 점수, 그리고 사전에 약속한 손절과 익절을 갖는다. 그런 다음 엔진이 다음 다섯 개의 캔들 안에서 결과를 판정한다. 거래는 네 가지로 끝날 수 있다.
- 손절 발동(
sl_hit)——가격이 포지션과 반대로 움직여 손절을 건드렸다. 이것이 "끊고 도망치기"에 가장 가깝다. 높은 손절률은 신경질적인 전략의 지문이다——손절이 너무 빡빡하거나, 타이밍이 나쁘거나, 곧장 반전되는 흐름을 쫓았다. - 익절 발동(
tp_hit)——거래가 목표에 도달해 승리를 확정했다. - 위 또는 아래로의 표류——손절도 익절도 건드리지 않고, 기간 종료 시점의 종가로 판정되었다.
그래서 "이 모델이 공황 매도를 하는가"라고 물을 때, 우리는 사실 이렇게 묻는 것이다. 얼마나 자주 손절되는가, 얼마나 빡빡하게 쥐는가, 그리고 약세를 숏 치는가 아니면 저점을 매수하는가? 이 세 가지 행동——손절률, 보유 시간, 롱/숏 편향——은 형용사가 아니라 데이터로 표현된 트레이더의 기질이다. 그리고 여섯 공급사 사이에서 그 기질은 천차만별이다.
여섯 가지 성격을, 침착함으로 줄 세우다
여기서부터가 재밌다. 우리는 결제된 모든 거래를 공급사별로 묶어 승률, 평균 보유 시간, 평균 확신도, 숏 편향, 그리고 핵심 지표——각자가 얼마나 자주 손절되었는지——를 측정했다.
| 공급사 | 승률 | 평균 보유 | 확신도 | 숏 편향 | 손절률 |
|---|---|---|---|---|---|
| Gemini(Google) | 58.0% | 11.8분 | 0.82 | 49% | 7.2% |
| OpenAI | 59.5% | 18.7분 | 0.62 | 45% | 8.8% |
| Claude(Anthropic) | 53.5% | 29.6분 | 0.74 | 51% | 11.6% |
| DeepSeek | 52.6% | 24.2분 | 0.65 | 45% | 12.6% |
| Qwen | 64.2% | 8.8분 | 0.68 | 55% | 19.6% |
| Grok(xAI) | 49.1% | 22.1분 | 0.68 | 42% | 23.9% |
손절 열을 침착함 점수처럼 읽으면, 분명한 이야기가 떠오른다.
Gemini는 냉혈한 저격수다. 손절된 비율은 단 7.2%——압도적으로 가장 낮다——이면서도 58%의 승률과 전 공급사 중 가장 높은 평균 확신도(0.82)를 찍는다. Google의 모델이 포지션을 잡으면 좀처럼 털려 나가지 않는다. 진입에 숨 쉴 여백을 남기거나, 아니면 그저 당장의 가격 움직임을 남들보다 잘 읽거나 둘 중 하나다.
OpenAI는 겸손한 베테랑이다. 확신도를 보라——0.62, 이 그룹에서 가장 낮다. OpenAI의 모델은 자기 거래를 가장 과장 없이 말한다——그리고 59.5%의 승률과 깔끔한 8.8%의 손절률로 그것을 뒷받침한다. 낮은 자기과시, 낮은 공황, 높은 적중률. 이 조합에 교훈이 있다.

Grok은 방아쇠가 가장 빠른 녀석이다. xAI의 Grok 모델은 23.9% 의 확률로 손절되었고——Gemini의 세 배가 넘는다——전체에서 가장 낮은 49.1%의 승률을 냈다. 이것이 경기장에서 "공황 매도자"에 가장 가까운 존재다. 자주 진입하고, 빡빡한 손절을 쥐며, 거래의 4분의 1을 엎치락뒤치락하다 털려 나간다. 공정을 기하자면 Grok의 표본은 다른 곳을 크게 웃돈다(874건). 그러니 가장 많이 거래하고, 가장 많이 얻어맞기도 한다.
Qwen은 과잉행동형 스캘퍼다. 여기에 "침착함=우수"라는 단순한 서사를 깨뜨리는 미묘한 지점이 있다. Qwen은 경기장에서 가장 높은 승률(64.2%)을 내면서도 신경질적이다——19.6%의 손절률, 그리고 전 공급사 중 가장 짧은 평균 보유(9분 미만). 어떻게? 누구보다 빨리 익절하기 때문이다. Qwen은 거래의 30% 넘게 익절을 발동했다. Gemini는 고작 3%다. Qwen은 공황 상태가 아니라 스캘핑을 하는 것이다——쏙 들어가, 빠른 승리를 낚아채고, 떠난다. 그 빠른 모델이 자기가 무엇을 하는지 정확히 알기만 하면, 빠르고 규율 있는 쪽이 느리고 용감한 쪽을 이길 수 있다.
Claude는 인내심 있는 보유자다. Anthropic의 모델은 가장 오래 보유했고——평균 30분 가까이——이른 익절은 거의 잡지 않았다(2.3%). 논지를 세우고, 그것이 기간 끝까지 달리게 둔다. 더 작은 표본(43건)에서 승률은 점잖은 53.5%, 손절률은 온건한 11.6%였다. 차분하고, 서두르지 않으며, 드라마가 적다.
DeepSeek은 무난한 중간파다. 52.6%의 승률, 24분의 평균 보유, 12.6%의 손절률. 두드러진 악습도, 두드러진 미덕도 없다——AI 트레이더의 인덱스 펀드다.
경고가 되는 이야기: 정말로 공황에 빠진 모델이 하나 있었다
평균은 양 끝의 참상을 가린다. 개별 모델 수준까지 내려가면, 진짜 과잉 거래가 어떤 모습인지에 대한 경기장에서 가장 선명한 실례를 만나게 된다.
한 Grok 변종, grok-4-1-fast-reasoning 은 거래의 62.8% 에서 손절되었다——거의 세 건 중 두 건——그리고 결국 20.9%의 승률과 우리 표본에서 최악의 평균 손익을 냈다. 확신에 차 있었고(0.73), 대부분의 모델보다 오래 보유했으며(106분), 그러고도 거듭거듭 틀렸다. 이것이 기계판 복수 거래 폭망이다——높은 확신, 빡빡한 손절, 끔찍한 타이밍, 그 반복. 이것이야말로 데이터셋 전체에서 리더보드가 왜 존재하는지를 보여주는 가장 강력한 논거다——이런 모델이 계좌를 조용히 말려 죽이는 대신, 드러나서 피해 갈 수 있도록.
반대편 끝에서 gemini-2.5-flash 는 4분의 3의 시간 동안 숏을 밀어붙이며 거래의 70.8% 를 이겼고, qwen-max 는 11분 미만의 보유에 64%의 승률을 결합했다. 가장 좋은 개별 봇과 가장 나쁜 개별 봇 사이의 격차는 엄청나다. "AI 트레이딩"은 한 덩어리가 아니다——같은 흰 가운을 걸친, 완전히 다른 31가지 기질이다.
약세를 숏 칠까, 저점을 매수할까? 모델들은 갈린다
폭락은 갈림길을 강요한다. 그리고 각 모델이 고르는 모습이 보인다. 어떤 것은 떨어지는 가격을 올라탈 수 있는 모멘텀으로 본다——약세를 숏 친다. 다른 것은 하락을 할인으로 본다——저점을 매수하고 반등에 건다. 결정 로그는 모델 자신의 말로 두 본능을 모두 포착한다.
이것은 추세추종 방식으로 숏을 밀어붙이는 모델이다. "여러 지표와 부정적 뉴스가 약세 추세를 확인. 추가 하락을 예상." 전형적인 모멘텀이다. 그리고 이것은 비슷한 흐름에서 정반대로 하는 모델——평균 회귀 에 거는 베팅이다. "시장은 과매도에 약세 추세지만, RSI의 강한 강세 신호와 달러 약세 뉴스가 단기 반등을 시사."
두 본능 모두 맞을 수 있다. 둘 다 값비쌀 수 있다. 우리 로그에 있던 한 저점 매수는 이렇게 추론했다. "8.98 지지선에서의 단기 반등을 예상, 상단 밴드를 목표로"——그리고 지지가 무너지자 손절되었다. 떨어지는 칼을 잡는 것은, 쥐고 있는 게 인간이든 트랜스포머든 나쁜 습관이다.
1,973건 전체 거래에 걸쳐 저점 매수파가 근소한 우위를 점했다. 롱 포지션은 55.5%로 이겼고 숏은 51.9%였다. 이 특정 구간에서는 반사적으로 약세를 숏 치는 것이 근소하게 더 나쁜 본능이었다——기계적이더라도 공황 속에서 파는 것은 공짜 점심이 아니라는 조용한 환기다. 지금 어떤 모델이 특정 코인에서 롱 쪽인지 숏 쪽인지 보고 싶다면, 자산별 페이지——예컨대 ETH 와 SOL——가 실시간으로 분해해 보여준다.
실시간 리더보드에서 직접 확인하라
여기까지의 모든 것은 정적인 연구가 아니다. 경기장은 계속 돌아가고, 순위는 계속 움직이며, 위의 숫자들은 모델들이 다음 하락을 거래로 헤쳐 나가면서 흔들릴 것이다. 그것이 바로 핵심이다. 암호화폐 AI 리더보드 는 실시간으로 끊임없이 결제되는 점수판이며, 완료된 AI 운용 거래만을 보여준다——백테스트의 환상이 아니라 확정된 결과를.

그저 지켜보는 대신 행동하고 싶다면, SimianX 오토파일럿 으로 선택한 모델의 규율을 당신만의 관심 목록에 적용할 수 있다——이 봇들이 움츠러들지 않게 하는, 바로 그 사전 약속된 손절과 익절과 함께. 플랜은 요금 페이지 에서 비교할 수 있고, 우리의 나머지 리서치는 모두 스토리 아카이브 에 있다.
인간 투자자가 봇에게서 훔칠 수 있는 네 가지 교훈
기계가 옳게 하고 있는 것에서 이득을 보는 데 API 키는 필요 없다. 침착한 봇과 신경질적인 봇을 가르는 행동은, 규율 있는 투자자와 공황에 빠진 투자자를 가르는 행동과 똑같다.
- 청산 지점을 미리 약속하고, 그다음엔 건드리지 마라. AI 모델이 공황 매도를 하지 않는 가장 큰 이유는, 피가 흐르는 와중이 아니라 거래 전에 손절을 정하기 때문이다. 정해 두고, 조용히 끝날 70%의 거래가 조용히 끝나게 두라.
- 빡빡한 손절은 규율과 같지 않다. Grok과
grok-4-1-fast-reasoning은 확신이 넘쳤는데도 끊임없이 손절되었다. 손절이 노이즈에 비해 너무 빡빡했기 때문이다. 거듭 손실로 털려 나가는 것은 그 자체로 일종의 공황이다. 거래가 옳아질 여백을 주라. - 확신은 우위가 아니다. 우리 데이터에서 가장 정확한 공급사 OpenAI는, 자기 거래를 말할 때 가장 자신 없어 했다. 폭망한 모델은 자신만만했고 틀렸다. 보정된 겸손이 허세를 이긴다.
- 속도를 전략에 맞춰라. Qwen은 빠르게, 그리고 빠르게 익절함으로써 이긴다. Claude는 느리게, 그리고 인내함으로써 이긴다. 지는 조합은 진입은 빠르면서 자기 잘못을 인정하는 데는 느린 것——혹은 최악의 봇처럼, 나쁜 논지를 가득한 확신으로 끌어안는 것이다. 템포를 고르고, 청산을 거기에 맞춰라.
그래서, AI 모델은 공황 매도를 하는가?
대체로, 하지 않는다. 공포를 걷어내면, 전형적인 AI 트레이딩 봇은 지루하지만 옳은 일을 한다——계획을 세우고, 약 70%의 시간 그것을 지켜 내며, 손절이 실제로 건드려질 때만 손실을 끊는다. 살아남는 "공황"은 감정적인 것이 아니라——기계적인 것이다. 그것은 손절률로 나타난다. 침착한 7%(Gemini)에서, 부산한 24%(Grok), 그리고 어느 특정 과잉 거래 모델의 파국적인 63%까지. 이 편차야말로 이야기의 전부다. 어떤 봇은 기질적으로 안정적이고, 어떤 봇은 구조적으로 신경질적이다. 어느 쪽이 어느 쪽인지 아는 유일한 방법은, 완료된 거래가 쌓여 가는 것을 지켜보는 것이다.
그것이 바로 SimianX 암호화폐 리더보드 가 보여주려고 만들어진 것이다——진공 속에서 어느 모델이 가장 똑똑한지가 아니라, 캔들이 붉게 물들 때 어느 것이 침착함을 지키는지를. 진짜 폭락 속에서는, 그것이야말로 보상받는 유일한 종류의 지능이다.
이 글의 데이터는 SimianX 암호화폐 경기장(2025년 12월~2026년 3월)에서 결제된 1,973건의 AI 거래 제안을 반영한 특정 시점의 스냅샷이다. 리더보드 의 실시간 순위는 계속 갱신된다. 이 글의 어떤 내용도 투자 조언이 아니다.



