Публикации
2023 г. – новый этап практического применения CXL, статья
VMware сдвигает акцент в проекте Capitola на CXL, статья
Dell Validated Design for Analytics — Data Lakehouse: интегрированное хранилище данных, статья
OCP Global Summit: решения для Computational Storage и компонуемых масштабируемых архитектур, статья
Samsung CXL MemoryySemantic SSD: 20M IOPs, статья
UCIe – открытый протокол для взаимосвязи чиплетов и построения дезагрегированных инфраструктур, статья
Omni-Path Express – открытый интерконнект для экзафлопных HPC/AI-систем, статья
GigaIO: CDI_решение на базе AMD для высшего образования, статья
Энергоэффективные ЦОД на примерах решений Supermicro, Lenovo, Iceotope, Meta, статья
От хранилищ данных и “озер данных” к open data lakehouse и фабрике данных, статья
EuroHPC JU развивает НРС-экосистему на базе RISC-V, статья
LightOS™ 2.2 – программно-определяемое составное блочное NVMe/TCP хранилище, статья
End-to-end 64G FC NAFA, статья
Computational Storage, статья
Технология KIOXIA Software-Enabled Flash™, статья
Pavilion: 200 млн IOPS на стойку, статья
CXL 2.0: инновации в операциях Load/Store вводаавывода, статья
Тестирование референсной архитектуры Weka AI на базе NVIDIA DGX A100, статья
Fujitsu ETERNUS CS8000 – единая масштабируемая платформа для резервного копирования и архивирования, статья
SmartNIC – новый уровень инфраструктурной обработки, статья
Ethernet SSD, JBOF, EBOF и дезагрегированные хранилища, статья
Compute, Memory и Storage, статья
Lenovo: CXL – будущее серверов с многоуровневой памятью , статья
Liqid: компонуемые дезагрегированные инфраструктуры для HPC и AI, статья
Intel® Agilex™ FPGA, статья
Weka для AI-трансформации, статья
Cloudera Data Platform – “лучшее из двух миров”, статья
Fujitsu ETERNUS DSP - разработано для будущего, статья
Технологии охлаждения для следующего поколения HPC-решений, статья
Что такое современный HBA?, статья
Fugaku– самый быстрый суперкомпьютер в мире, статья
НРС – эпоха революционных изменений, статья
Новое поколение СХД Fujitsu ETERNUS, статья
Зональное хранение данных, статья
За пределами суперкомпьютеров, статья
Применение Intel® Optane™ DC и Intel® FPGA PAC, статья
Адаптивные HPC/AI-архитектуры для экзаскейл-эры, статья
DAOS: СХД для HPC/BigData/AI приложений в эру экзаскейл_вычислений, статья
IPsec в пост-квантовую эру, статья
LiCO: оркестрация гибридныхНРС/AI/BigData_инфраструктур, статья
 
Обзоры
Все обзоры в Storage News
 
Тематические публикации
Flash-память
Облачные вычисления/сервисы
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
Современные СХД
Информационная безопасность (ИБ), борьба с мошенничеством
Рынки
Компания «ЦРТ-инновации» представила новый метод анализа больших данных

28, апрель 2016  —  Компания «ЦРТ-инновации» (группа компаний ЦРТ) при поддержке Министерства образования и науки РФ разработала уникальный метод выделения связных контекстов словоупотребления, ориентированный на работу с живой неподготовленной (спонтанной) речью. Использоваться новый метод будет в таких инструментах речевой аналитики ЦРТ, как «модуль кластеризации» и «модуль автоматического аннотирования».

Метод основан на технологиях работы с большими данными (big data) и современных методах машинного обучения (machine learning)  в сочетании с глубоким лингвистическим и семантическим анализом речи.

Особенно остро проблема «понимания» речи (речевого сообщения и/или большого объема речевых данных) стоит в крупных контакт-центрах, обрабатывающих информацию в постоянном режиме и больших объемах. Именно поэтому основными потенциальными потребителями систем, автоматически выделяющих связные контексты (логические структуры, «ситуации») тех или иных значимых для анализа слов, являются аналитические службы КЦ и служб технической поддержки государственных и коммерческих структур.

Цель выделения контекстов в больших массивах данных - учитывать информацию, непосредственно связанную с целевым словом, и не включать в контекст нерелевантную информацию. Выделение связных контекстов слов в разы упрощает работу аналитиков, позволяя им в автоматическом режиме решать такие задачи, как:

  • анализ употребления ключевых слов (людей, организаций, географических объектов) в тексте и/или речи;
  • выявление контекстов употребления ключевых (значимых) слов в диалогах;
  • составление текстовой аннотации (информативной выжимки) текста и/или речи;
  • автоматическое формирование заголовков тематических кластеров и т.п.
Публикации по теме
Специализ. СХД для BI-хранилищ, аналитика "больших данных", интеграция данных
 
Новости ЦРТ

© "Storage News" journal, Russia&CIS
(495) 233-4935;
www.storagenews.ru; info@storagenews.ru.