Hệ Thống AI Y Khoa Tiên Tiến

Tích hợp đầy đủ các API AI y khoa, nhận dạng giọng nói, OCR, và chatbot thông minh

14 Services
4 GPUs
8+ AI Models

Các Dịch Vụ API

Hệ thống cung cấp 14 dịch vụ đang hoạt động với 1 AI Agent tổng hợp, 7 GPU services, 4 non-GPU services và 3 dịch vụ chuyên biệt

AI Agent — Trợ Lý Tổng Hợp

AI Agent — Unified Assistant

NEW CPU Orchestrator

Trợ lý AI tổng hợp thông minh — tự động nhận biết ý định và điều phối đến đúng service: ASR, OCR, dịch thuật, tóm tắt, tìm kiếm mã y tế, TTS, bệnh nhân ảo và hơn thế nữa. Hỗ trợ hội thoại có lịch sử session, streaming WebSocket real-time.

pnt.badt.vn/ai_agent/ Port: 8099 8 services tích hợp WebSocket streaming Intent detection

GPU Services

Medical Transcribe

CRITICAL GPU 1 - RTX 3070

Nhận dạng giọng nói y khoa tiếng Việt với PhoWhisper-large-peft-VietMed

pnt.badt.vn/medical_transcribe/ VRAM: 6.4GB/8GB Model: PhoWhisper

Face Recognition

GPU 0 - RTX 3060

API nhận dạng khuôn mặt với độ chính xác cao

pnt.badt.vn/face_recognition/ VRAM: 243MB/12GB

Gemma2 9B Local LLM

FAST GPU 0 - RTX 3060

LLM tiếng Việt siêu nhanh với Google Gemma 2 9B - 5-10x nhanh hơn API

pnt.badt.vn/gemma2/ VRAM: 6.5GB/12GB Model: Gemma-2-9B-AWQ ~39 tokens/sec

Vistral Vietnamese LLM

DISABLED GPU 2 - RTX 3060

⛔ Đã tắt (2026-03-20) — Chất lượng kém, thay thế bằng Qwen 2.5 & Gemma2. Model: SeaLLM-7B-v2.5.

pnt.badt.vn/vistral/ (inactive) Model: SeaLLM-7B

GPU Agent

Monitor

Giám sát và quản lý tài nguyên 4 GPU trong thời gian thực — VRAM, utilization, nhiệt độ, điều phối workload

pnt.badt.vn/gpu-agent/ Port: 8050 CPU-only

Qwen 2.5-7B LLM

Tool-calling GPU 2 - RTX 3060

LLM Qwen2.5-7B-Instruct-AWQ — hỗ trợ tool calling, primary LLM của AI Agent, tự động fallback sang Gemma2 khi cần

pnt.badt.vn/qwen/ Port: 8043 Qwen2.5-7B-AWQ ~5GB VRAM

DeepSeek OCR

GPU 3 - RTX 3060

OCR tiên tiến với DeepSeek-VL cho tiếng Việt và đa ngôn ngữ

pnt.badt.vn/deepseek_ocr/ VRAM: 1.3GB/12GB Model: DeepSeek-VL-1.3B

Non-GPU Services

Medical Patient Simulator

Mô phỏng bệnh nhân ảo với RAG và LLM cho giáo dục y khoa

pnt.badt.vn/virtualpatient/ Educational

MCP Backend

OAuth 2.0

ML API Gateway với Google OAuth 2.0 authentication

pnt.badt.vn/mcp/ Protected

Text-to-Speech

TTS

Chuyển văn bản thành giọng nói tự nhiên - Hỗ trợ 28+ ngôn ngữ

pnt.badt.vn/text2speech/ 28+ languages

CodeFinder

Semantic Search

Tìm kiếm ngữ nghĩa mã y tế (ICD10, ICPC2, CPT) với vector + BM25 hybrid search và cache 3 lớp

pnt.badt.vn/codefinder/ ChromaDB + BM25

Dịch Vụ Chuyên Biệt

MediTutor

Education

Hệ thống đào tạo y khoa tương tác — LLM-powered tutor, quiz, case-based learning cho sinh viên và bác sĩ

pnt.badt.vn/meditutor/ Port: 8028

Paper2Agent

Research

Chuyển đổi bài báo nghiên cứu thành AI agents — tự động extract methodology, replicate experiments từ paper

pnt.badt.vn/paper2agent/ Port: 8027 Long-running tasks

MedGemma Research

GPU Multimodal

Google MedGemma — model multimodal y tế chuyên dụng, hỗ trợ xử lý ảnh y tế và văn bản lâm sàng

pnt.badt.vn/medgemma/ Port: 8018

Hướng Dẫn Nhanh

Bắt Đầu

Tìm hiểu cách kết nối và sử dụng API

Xem hướng dẫn

Xác Thực

Hướng dẫn OAuth 2.0 và API keys

Tìm hiểu

Ví Dụ Code

Python, JavaScript, PHP examples

Xem code

Xử Lý Lỗi

HTTP status codes và error handling

Chi tiết

Trạng Thái Hệ Thống

Real-time Service Status

Đang kiểm tra trạng thái services...