Tích hợp đầy đủ các API AI y khoa, nhận dạng giọng nói, OCR, và chatbot thông minh
Hệ thống cung cấp 20 dịch vụ đang hoạt động với AI Agent trung tâm, 10 GPU services, 5 non-GPU services và 4 dịch vụ chuyên biệt
Trợ lý AI tổng hợp thông minh — tự động nhận biết ý định và điều phối đến đúng service: ASR, OCR, dịch thuật, tóm tắt, tìm kiếm mã y tế, TTS, bệnh nhân ảo và hơn thế nữa. Hỗ trợ hội thoại có lịch sử session, streaming WebSocket real-time.
Nhận dạng giọng nói y khoa tiếng Việt — 2 Workers + GPU Load Balancer, tối ưu tải real-time
API nhận dạng khuôn mặt với độ chính xác cao
Google Gemma 4 E4B — 29B tham số (AWQ 4-bit), context 4K (VRAM-limited), thinking mode, hỗ trợ tiếng Việt và 140+ ngôn ngữ — tối ưu cho suy luận y khoa.
Giám sát và quản lý tài nguyên 5 GPU trong thời gian thực — VRAM, utilization, nhiệt độ, điều phối workload
LLM Qwen2.5-7B-Instruct-AWQ — hỗ trợ tool calling, primary LLM của AI Agent, worker trong team mode cùng Gemma4 và Qwen3
Qwen3-14B-Claude-Distill — Model được chưng cất (distilled) từ Claude Opus 4.5, kế thừa khả năng suy luận chuyên sâu trong một model 14B nhỏ gọn. Hỗ trợ streaming SSE, OpenAI-compatible API, context window 14K tokens. Chạy trên GPU RTX 5060 Ti 16GB với vLLM backend. Đặc biệt mạnh trong phân tích lâm sàng phức tạp, giảng dạy y khoa và trả lời câu hỏi có cấu trúc.
Hệ thống Hỗ trợ Chẩn đoán Lâm sàng - LLM + Clinical Reasoning Maps + GNN/Bayesian Inference trên GPU. Phân tích triệu chứng, tính xác suất chẩn đoán động.
Mô phỏng bệnh nhân ảo với RAG và LLM cho giáo dục y khoa
Chuyển văn bản thành giọng nói tự nhiên - Hỗ trợ 28+ ngôn ngữ
Agent AI tự chủ chạy DeepSeek R1 — quản lý task, lập lịch, thực thi pipeline phân tích phức tạp. Kết nối từ máy chủ 192.168.1.248.
Đang kiểm tra trạng thái services...