VeloDB: UNIFIED DATA LAKEHOUSE
Единая архитектура OLAP + Vector + Full-Text Search. Заменяет ClickHouse + Elasticsearch + Spark + Trino. Совместима с MySQL-протоколом.
> Loading VeloDB Core Engine...
> Init Vector Search (HNSW/IVPQ)
> Init Full-Text BM25 Index
> Star-Schema Join Mapping
> SUCCESS: UNIFIED ENGINE READY
-- Hybrid Search: 4 движка в одном запросе
SELECT doc_id, title,
1.0/(60 + v.rank) + 1.0/(60 + b.rank) AS rrf
FROM vector_search('quarterly report risk', top=50) v
JOIN bm25_search('KYC AML SOFR №2864', top=50) b
USING (doc_id)
WHERE user_timezone = '__TZ__'
AND user_lang = '__LANG__'
ORDER BY rrf DESC LIMIT 10; ПРОБЛЕМЫ ТЕКУЩИХ РЕШЕНИЙ
// analysis_bottlenecks.log
Зоопарк Технологий
pest_controlClickHouse для аналитики, Elasticsearch для логов и поиска, Spark для ETL, отдельная система для ML. Дублирование данных, хрупкие конвейеры, высокая стоимость владения.
Стоимость & Lock-in
money_offOracle Exadata и Vertica требуют огромных лицензионных отчислений за ядро. Закрытый код ограничивает гибкость и привязывает инфраструктуру к планам вендора.
КЛЮЧЕВЫЕ ПРЕИМУЩЕСТВА ПЛАТФОРМЫ
Cost-Efficient
Прозрачная модель лицензирования за ядро. Значительная экономия по сравнению с Oracle Exadata, Vertica и Snowflake.
24/7 Enterprise Support
Реакция за 30 минут на критические запросы. Architecture Optimization, Performance Tuning, Solution Consulting, on-site поддержка.
Apache Doris Compatible
100% обратная совместимость с Apache Doris. Используйте существующие инструменты и миграции без изменений.
Unified Architecture
OLAP + Векторный поиск (HNSW/IVPQ) + Full-Text Search (BM25) + Lakehouse в одном движке. Один бинарник вместо 4 систем.
ДЛЯ КАКИХ ЗАДАЧ ПРИМЕНЯЕТСЯ VELODB
Интерактивная OLAP-аналитика и BI-дашборды с задержкой менее 100 мс на петабайтных данных
Полнотекстовый поиск и лог-аналитика с инвертированным индексом BM25 — замена Elasticsearch
Векторный поиск для AI/RAG: нативные HNSW/IVPQ индексы, гибридный поиск (vector + text + SQL)
Единая точка доступа к Data Lake: федеративные запросы к Iceberg, Hudi, Delta Lake
Real-time загрузка данных: CDC из MySQL/PostgreSQL, потоки из Kafka с задержкой ~1 секунда
Консолидация 4-5 систем в одну: OLAP + поиск + ML-фичи + Lakehouse в одном движке
Архитектура Open Data Lakehouse
Единое решение для пакетной и потоковой обработки
Batch Processing Engine
(Spark, Flink)
Real-Time Analytics Engine
(VeloDB / Apache Doris)
Data Lake
(Iceberg, Hudi, Delta Lake)
Catalog
(Polaris, Unity, Glue)
Real-Time Analytics Engine
VeloDB — движок аналитики реального времени. Интерактивная аналитика, лёгкие ETL-нагрузки, гибридный поиск.
Batch Processing Engine
Spark-подобные движки для длительных ETL процессов и ML-вычислений.
Open Lakehouse Storage
Открытое хранилище на базе Iceberg, Hudi и каталогов Polaris / Unity.
РЕЗУЛЬТАТЫ БЕНЧМАРКОВ
// benchmark_results.log
CoffeeBench (Real-World)
TPC-H (100GB)
КЕЙСЫ КЛИЕНТОВ
> 4000+ enterprise-клиентов по всему миру
Postal Savings Bank of China
Финансы / 650M+ клиентов / Антифрод
Антифрод-платформа на Apache Doris. Сравнение с ClickHouse, Greenplum, Cassandra, Kylin (5 раундов, 89 тестов) — выбран Doris.
China UnionPay
Финтех / Крупнейшая платёжная система
Замена Oracle OLAP. Обработка транзакций и аналитика в реальном времени.
Ping An Insurance
Страхование / Fortune 500
Замена Oracle для аналитики. Сокращение цикла разработки нового отчёта с 2 недель до 1 дня.
Hang Yin Bank
Финансы / Банковский мониторинг
Замена Vertica для мониторинга транзакций. Алертинг за секунды вместо минут.
ОТРАСЛИ
Финансы & Банки
Compliance-отчётность, фрод-детекция, аналитика транзакций в реальном времени
> Замена Oracle / Vertica
Ритейл & E-commerce
Рекомендации, A/B-тестирование, аналитика поведения покупателей
> Замена ClickHouse + Elasticsearch
Телеком & IoT
CDR-аналитика, мониторинг сети, IoT-потоки данных
> Замена Vertica / Teradata
МОДЕЛИ РАЗВЁРТЫВАНИЯ
BYOC (Bring Your Own Cloud)
Развёртывание в вашем облаке. Данные остаются под вашим контролем.
On-Premise / Air-Gapped
Полностью изолированная установка. Для организаций с требованиями по информационной безопасности.
ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ
Что такое Data Lakehouse и чем он отличается от Data Warehouse?
Data Lakehouse объединяет преимущества Data Lake (дешёвое хранение, открытые форматы) и Data Warehouse (ACID-транзакции, SQL-аналитика). VeloDB реализует эту архитектуру на основе Apache Doris — один движок для OLAP, поиска и AI без дублирования данных. В отличие от классического DWH, Lakehouse работает с открытыми форматами (Iceberg, Hudi, Delta Lake) и не привязывает вас к одному вендору.
Как VeloDB заменяет Oracle Exadata и Vertica?
VeloDB обеспечивает enterprise-уровень аналитики при снижении TCO на 40-70%. China UnionPay заменил Oracle OLAP, ускорив запросы в 100 раз. PSBC выбрал Doris вместо ClickHouse и Greenplum для антифрод-платформы (650M клиентов). VeloDB поддерживает MySQL-протокол, что упрощает миграцию. Enterprise-поддержка 24/7 с реакцией 30 минут.
Какие модели развёртывания доступны?
Две модели: BYOC (Bring Your Own Cloud) — развёртывание в вашем облаке с 30-дневным бесплатным пробным периодом, данные остаются под вашим контролем. On-Premise / Air-Gapped — полностью изолированная установка на вашей инфраструктуре для организаций с жёсткими требованиями по информационной безопасности.
Насколько VeloDB совместим с Apache Doris?
VeloDB имеет 100% обратную совместимость с Apache Doris. Команда VeloDB — это основатели Apache Doris: 1 PMC Chair, 9 членов PMC, 26 коммиттеров. Все существующие инструменты, драйверы и SQL-запросы работают без изменений. VeloDB добавляет enterprise-функции: управление нагрузкой, расширенную безопасность и SLA-поддержку.
Как обеспечивается безопасность данных?
При BYOC и On-Premise моделях данные никогда не покидают вашу инфраструктуру. VeloDB поддерживает RBAC, шифрование данных at-rest и in-transit, аудит-логирование и интеграцию с LDAP/Kerberos. Для регулируемых отраслей (банки, госсектор) доступен режим Air-Gapped без подключения к интернету.
Каковы результаты бенчмарков по сравнению с конкурентами?
На бенчмарке CoffeeBench (реальные нагрузки): VeloDB в 8 раз быстрее и в 8 раз дешевле ClickHouse, в 5 раз быстрее и в 14 раз дешевле Snowflake. На TPC-H (100GB): в 3 раза быстрее ClickHouse, в 6 раз быстрее Snowflake. VeloDB выполняет все 99 запросов TPC-DS — стандартного enterprise-бенчмарка.
Сколько стоит миграция с текущей платформы?
Datanomix предоставляет бесплатный архитектурный аудит и POC (Proof of Concept) для предприятий Центральной Азии. Стоимость миграции зависит от текущей архитектуры и объёма данных. MySQL-совместимость VeloDB значительно упрощает миграцию — многие SQL-запросы работают без изменений.
Кто уже использует VeloDB и Apache Doris в production?
Более 4000 enterprise-компаний по всему миру: ByteDance, Tencent, Postal Savings Bank of China (антифрод-платформа, 650M клиентов), China UnionPay (замена Oracle OLAP), Ping An Insurance (Fortune 500), ZTO Express, Netease и другие. В финансовом секторе — аналитика транзакций, антифрод и compliance-отчётность.