Los datos no estructurados pueden hacer referencia a cualquier contenido de datos, incluidos varios archivos de texto, imágenes, videos y audios. Por lo general, algunos datos no estructurados pueden tener estructuras internas, pero las estructuras internas son flexibles y no son adecuadas para almacenarse en una base de datos relacional tradicional. En las últimas décadas, se han desarrollado diferentes protocolos para acceder a datos no estructurados para diferentes aplicaciones, incluidos S3, HDFS, NFS, SMB y FTP. Existen muchos tipos de datos no estructurados y protocolos de acceso. Por lo tanto, los clientes generalmente necesitan implementar diferentes productos de almacenamiento con protocolos específicos para cumplir con los requisitos de diferentes escenarios de servicio. Por ejemplo, los clientes necesitan implementar almacenamiento de objetos S3 para respaldar los requisitos del servicio, como servicios de imágenes de recibos, e implementar almacenamiento de big data HDFS para respaldar servicios de análisis como Hadoop y Spark. Implementar almacenamiento NFS/SMB para respaldar servicios PACS.
Con el desarrollo de tecnologías como 5G e IoT, los datos no estructurados aumentan de manera explosiva y esto hace que cada vez más clientes implementen múltiples conjuntos de dispositivos de almacenamiento para brindar soporte a diferentes servicios. Al mismo tiempo, con el uso generalizado de la infraestructura de TI de nube pública y nube privada y la diferencia en los costos de consumo de energía causada por el desequilibrio en el desarrollo regional, surgen nuevos modos de aplicación, como datos ingeridos en una región pero analizados en otra o datos ingeridos en un clúster local pero analizados en la nube pública. Por lo tanto, el acceso unificado a los datos en diferentes sistemas de almacenamiento y regiones se convierte en el requisito básico de capacidad de TI de la mayoría de las empresas. El Sistema de archivos global (GFS) de OceanStor Pacific es una característica avanzada diseñada para cumplir con los requisitos anteriores. Proporciona capacidades de uso compartido unificadas para datos heterogéneos y datos entre regiones.
GFS admite el intercambio de datos heterogéneos de múltiples fuentes, lo que acelera el acceso a los datos.
En el entorno de producción de la mayoría de los clientes, se implementan diferentes productos de almacenamiento para admitir diferentes escenarios de aplicación, como se muestra en la Figura 1.