GT DF или Generic Tool for Data Fusion – мощный инструмент для обработки данных разной точности. GT DF является частью pSeven Core, доступной в pSeven. Модуль позволяет строить аппроксимационные модели с использованием данных переменной точности, в то время как GTApprox позволяет обрабатывать данные только одной точности. В качестве входа GT DF использует точные данные и грубые данные. Предполагается, что данные получены соответственно с использованием точной и грубой функции. Результатом работы модуля является аппроксимационная модель для точной функции.
Режимы работы и техники
Консолидация данных разной точности работает в двух режимах:
режим выборки
режим черного ящика
В режим выборки входом являются выборки точных данных и грубых данных. Они состоят из точек и значений соответствующих функций в этих точках. В режиме черного ящика продукт принимает на вход выборку точных данных и черный ящик для грубых данных, который позволяет вычислять значения грубой функции в заданной области. Аппроксимационная модель, построенная в режиме черного ящика, способна оценивать точную функцию в новых точках как с использованием черного ящика для грубой функции, так и без его использования.
Техники
В GT DF пользователь может выбрать одну из четырех техник построения аппроксимационной модели:
HFA (High Fidelity Approximation) — использует только точные данные,
DA (Difference Approximation) — аппроксимирует разность между точной и грубой функцией,
VFGP (Variable Fidelty Gaussian Processes) — использует идеи из регрессии на основе гауссовских процессов,
SVFGP (Sparse Variable Fidelity Gaussian Processes) — разработан для использования VFGP в случае больших выборок данных.
Модуль осуществляет автоматический выбор техники на основе предоставленных данных и требований пользователя.
Кроме того, модуль DF:
Позволяет получать как значения аппроксимации, так и их производные;
Обеспечивает контроль пользователя за временем обучения модели;
Обрабатывает выборки с широким диапазоном размеров, размерностей входа и выхода;
Обеспечивает интерполяцию данных;
Позволяет для новых точек теоретически оценить точность прогноза;
Оценивает качество полученных аппроксимационных моделей в процессе их построения с помощью скользящего контроля.
Пример использования
Рассмотрим пример использования GT DF для решения инженерной задачи. Цель задачи состоит в построении аппроксимационных моделей для аэродинамических коэффициентов подъемной силы и сопротивления для фиксированного крыла в зависимости от угла атаки.
Точные и грубые данные получаются как численное решение уравнений Эйлера, но для того, что бы подсчитать значение грубой функции используется более грубая сетка. Мы строим аппроксимационные модели с использованием GT Approx, используя только точные данные, и с помощью GT DF, используя как точные, так и грубые данные. Для сравнения результатов работы используется среднеквадратичная ошибка (MSE), подсчитанная для тестовой выборки точных данных.
Результаты представлены в таблице выше. Они демонстрируют, что использование GT DF существенно улучшает качество аппроксимационных моделей и для коэффициента подъемной силы, и для коэффициента сопротивления.