자주 묻는 질문 (FAQ)
진입 장벽을 낮추기 위한 Q&A 형식입니다. 상세 해결은 문제 해결 참조.
VPN / wire
Q: VPN 연결이 안 될 때
A: 다음 순서로 확인하세요.
- 릴레이 서버 동작 여부:
curl http://RELAY_IP:8786/peers - 방화벽: 8786(TCP), 51830(UDP) 개방
- 30초 대기 후
wg show wire0재확인 - 모든 노드가 동일한 relay URL 사용하는지 확인
Q: 피어가 보이지 않을 때
A:
- relay URL이 모든 클라이언트에서 동일해야 함
- 릴레이 서버 재시작 후 1~2분 대기
wire status또는python3 wire/wire_pkg/cli.py status로 피어 목록 확인
Agent / 메트릭
Q: agent가 메트릭을 못 보낼 때
A:
- agent 실행 여부:
mpop-agent status(g1 등 실행 노드에서) - VSSH 연결: agent는 vssh로 원격 메트릭 수집.
vssh info g1동작 확인 - VSSH_SECRET: agent와 대상 서버의
VSSH_SECRET일치 - 방화벽: vssh 포트(48291) 개방
Q: 대시보드에 메트릭이 안 나올 때
A:
- mpop은 vssh로 각 서버에 접속해 실시간 조회
mpop config test로 연결 테스트- 특정 노드만 안 나오면: 해당 노드 vssh 데몬, VPN 연결 확인
서버 추가 / 설정
Q: 서버를 추가했는데 dashboard에 안 나올 때
A:
- config 반영:
mpop config auto또는 config.json에 수동 추가 - VPN 연결: 새 서버에서
wg show wire0로 10.99.x.x 확인 - vssh: 새 서버에서
vssh server실행, VSSH_SECRET 설정 - mpop 재실행: config 변경 후
mpop다시 실행
Q: mpop exec 타임아웃이 날 때
A:
- 전체 서버 exec는 노드 수에 비례해 30초+ 소요
- 해결:
mpop exec -t g1 "cmd"처럼-t로 단일 서버 지정
meshdb
Q: meshdb search 결과가 없을 때
A:
meshdb index ~/projects먼저 실행- 인덱싱 완료까지 수 분~수십 분 소요 가능
meshdb status로 documents 수 확인
Q: meshdb --smart가 안 될 때
A:
- Ollama가 실행 중인지 확인 (
ollama serve) - config의
ollama_host(예: g1)에서 Ollama 접근 가능한지 확인
알림 / watch
Q: mpop watch --alert에서 Telegram이 안 올 때
A:
mpop alert setup telegram으로 Bot Token, Chat ID 설정mpop alert test로 테스트 메시지 전송 확인- alert 설정은 v1 등
/var/lib/mpop/alert.json에 저장됨
Q: GPU Mem이 -로 나올 때
A:
- 일부 GPU(nvidia-smi 출력 형식)는 파싱 실패 시
-표시 - RTX 4090, A6000 등은
4321/24564MB형식으로 정상 표시 - GPU 드라이버/nvidia-smi 버전에 따라 다름