Source code for yt.utilities.grid_data_format.conversion.conversion_athena

import os
from glob import glob

import numpy as np

from yt.utilities.grid_data_format.conversion.conversion_abc import Converter
from yt.utilities.on_demand_imports import _h5py as h5py

translation_dict = {}
translation_dict["density"] = "density"
translation_dict["total_energy"] = "specific_energy"
translation_dict["velocity_x"] = "velocity_x"
translation_dict["velocity_y"] = "velocity_y"
translation_dict["velocity_z"] = "velocity_z"
translation_dict["cell_centered_B_x"] = "mag_field_x"
translation_dict["cell_centered_B_y"] = "mag_field_y"
translation_dict["cell_centered_B_z"] = "mag_field_z"



[docs]
class AthenaDistributedConverter(Converter):
    def __init__(self, basename, outname=None, source_dir=None, field_conversions=None):
        self.fields = []
        self.current_time = 0.0
        name = basename.split(".")
        self.ddn = int(name[1])
        if source_dir is None:
            source_dir = "./"
        self.source_dir = source_dir
        self.basename = name[0]
        if outname is None:
            outname = self.basename + ".%04i" % self.ddn + ".gdf"
        self.outname = outname
        if field_conversions is None:
            field_conversions = {}
        self.field_conversions = field_conversions
        self.handle = None


[docs]
    def parse_line(self, line, grid):
        # grid is a dictionary
        splitup = line.strip().split()
        if "vtk" in splitup:
            grid["vtk_version"] = splitup[-1]
        elif "Really" in splitup:
            grid["time"] = splitup[-1]
            self.current_time = grid["time"]
        elif "PRIMITIVE" in splitup:
            grid["time"] = float(splitup[4].rstrip(","))
            grid["level"] = int(splitup[6].rstrip(","))
            grid["domain"] = int(splitup[8].rstrip(","))
            self.current_time = grid["time"]
        elif "DIMENSIONS" in splitup:
            grid["dimensions"] = np.array(splitup[-3:], dtype="int64")
        elif "ORIGIN" in splitup:
            grid["left_edge"] = np.array(splitup[-3:], dtype="float64")
        elif "SPACING" in splitup:
            grid["dds"] = np.array(splitup[-3:], dtype="float64")
        elif "CELL_DATA" in splitup:
            grid["ncells"] = int(splitup[-1])
        elif "SCALARS" in splitup:
            field = splitup[1]
            grid["read_field"] = field
            grid["read_type"] = "scalar"
        elif "VECTORS" in splitup:
            field = splitup[1]
            grid["read_field"] = field
            grid["read_type"] = "vector"



[docs]
    def write_gdf_field(self, fn, grid_number, field, data):
        f = self.handle
        ## --------- Store Grid Data --------- ##
        if "grid_%010i" % grid_number not in f["data"].keys():
            g = f["data"].create_group("grid_%010i" % grid_number)
        else:
            g = f["data"]["grid_%010i" % grid_number]
        name = field
        try:
            name = translation_dict[name]
        except Exception:
            pass
        # print 'Writing %s' % name
        if name not in g.keys():
            g.create_dataset(name, data=data)



[docs]
    def read_and_write_index(self, basename, ddn, gdf_name):
        """Read Athena legacy vtk file from multiple cpus"""
        proc_names = glob(os.path.join(self.source_dir, "id*"))
        # print('Reading a dataset from %i Processor Files' % len(proc_names))
        N = len(proc_names)
        grid_dims = np.empty([N, 3], dtype="int64")
        grid_left_edges = np.empty([N, 3], dtype="float64")
        grid_dds = np.empty([N, 3], dtype="float64")
        grid_levels = np.zeros(N, dtype="int64")
        grid_parent_ids = -1 * np.ones(N, dtype="int64")
        grid_particle_counts = np.zeros([N, 1], dtype="int64")

        for i in range(N):
            if i == 0:
                fn = os.path.join(
                    self.source_dir, f"id{i}", basename + f".{ddn:04d}.vtk"
                )
            else:
                fn = os.path.join(
                    self.source_dir, f"id{i}", basename + f"-id{i}.{ddn:04d}.vtk"
                )

            print(f"Reading file {fn}")
            f = open(fn, "rb")
            grid = {}
            grid["read_field"] = None
            grid["read_type"] = None
            line = f.readline()
            while grid["read_field"] is None:
                self.parse_line(line, grid)
                if "SCALAR" in line.strip().split():
                    break
                if "VECTOR" in line.strip().split():
                    break
                if "TABLE" in line.strip().split():
                    break
                if len(line) == 0:
                    break
                del line
                line = f.readline()

            if len(line) == 0:
                break

            if np.prod(grid["dimensions"]) != grid["ncells"]:
                grid["dimensions"] -= 1
                grid["dimensions"][grid["dimensions"] == 0] = 1
            if np.prod(grid["dimensions"]) != grid["ncells"]:
                print(
                    "product of dimensions %i not equal to number of cells %i"
                    % (np.prod(grid["dimensions"]), grid["ncells"])
                )
                raise TypeError

            # Append all hierarchy info before reading this grid's data
            grid_dims[i] = grid["dimensions"]
            grid_left_edges[i] = grid["left_edge"]
            grid_dds[i] = grid["dds"]
            # grid_ncells[i]=grid['ncells']
            del grid

            f.close()
            del f
        f = self.handle

        ## --------- Begin level nodes --------- ##
        g = f.create_group("gridded_data_format")
        g.attrs["format_version"] = np.float32(1.0)
        g.attrs["data_software"] = "athena"
        f.create_group("data")
        f.create_group("field_types")
        f.create_group("particle_types")
        pars_g = f.create_group("simulation_parameters")

        gles = grid_left_edges
        gdims = grid_dims
        dle = np.min(gles, axis=0)
        dre = np.max(gles + grid_dims * grid_dds, axis=0)
        glis = ((gles - dle) / grid_dds).astype("int64")

        ddims = (dre - dle) / grid_dds[0]

        # grid_left_index
        f.create_dataset("grid_left_index", data=glis)
        # grid_dimensions
        f.create_dataset("grid_dimensions", data=gdims)

        # grid_level
        f.create_dataset("grid_level", data=grid_levels)

        ## ----------QUESTIONABLE NEXT LINE--------- ##
        # This data needs two dimensions for now.
        f.create_dataset("grid_particle_count", data=grid_particle_counts)

        # grid_parent_id
        f.create_dataset("grid_parent_id", data=grid_parent_ids)

        ## --------- Done with top level nodes --------- ##

        pars_g.attrs["refine_by"] = np.int64(1)
        pars_g.attrs["dimensionality"] = np.int64(3)
        pars_g.attrs["domain_dimensions"] = ddims
        pars_g.attrs["current_time"] = self.current_time
        pars_g.attrs["domain_left_edge"] = dle
        pars_g.attrs["domain_right_edge"] = dre
        pars_g.attrs["unique_identifier"] = "athenatest"
        pars_g.attrs["cosmological_simulation"] = np.int64(0)
        pars_g.attrs["num_ghost_zones"] = np.int64(0)
        pars_g.attrs["field_ordering"] = np.int64(1)
        pars_g.attrs["boundary_conditions"] = np.int64([0] * 6)  # For Now

        # Extra pars:
        # pars_g.attrs['n_cells'] = grid['ncells']
        pars_g.attrs["vtk_version"] = 1.0


        # Add particle types
        # Nothing to do here

        # Add particle field attributes
        # f.close()


[docs]
    def read_and_write_data(self, basename, ddn, gdf_name):
        proc_names = glob(os.path.join(self.source_dir, "id*"))
        # print('Reading a dataset from %i Processor Files' % len(proc_names))
        N = len(proc_names)
        for i in range(N):
            if i == 0:
                fn = os.path.join(
                    self.source_dir, f"id{i}", basename + f".{ddn:04d}.vtk"
                )
            else:
                fn = os.path.join(
                    self.source_dir, +f"id{i}", basename + f"-id{i}.{ddn:04d}.vtk"
                )
            f = open(fn, "rb")
            # print('Reading data from %s' % fn)
            line = f.readline()
            while line != "":
                if len(line) == 0:
                    break
                splitup = line.strip().split()

                if "DIMENSIONS" in splitup:
                    grid_dims = np.array(splitup[-3:], dtype="int64")
                    line = f.readline()
                    continue
                elif "CELL_DATA" in splitup:
                    grid_ncells = int(splitup[-1])
                    line = f.readline()
                    if np.prod(grid_dims) != grid_ncells:
                        grid_dims -= 1
                        grid_dims[grid_dims == 0] = 1
                    if np.prod(grid_dims) != grid_ncells:
                        print(
                            "product of dimensions %i not equal to number of cells %i"
                            % (np.prod(grid_dims), grid_ncells)
                        )
                        raise TypeError
                    break
                else:
                    del line
                    line = f.readline()
            read_table = False
            while line != "":
                if len(line) == 0:
                    break
                splitup = line.strip().split()
                if "SCALARS" in splitup:
                    field = splitup[1]
                    if not read_table:
                        line = f.readline()  # Read the lookup table line
                        read_table = True
                    data = np.fromfile(f, dtype=">f4", count=grid_ncells).reshape(
                        grid_dims, order="F"
                    )
                    if i == 0:
                        self.fields.append(field)
                    # print('writing field %s' % field)
                    self.write_gdf_field(gdf_name, i, field, data)
                    read_table = False

                elif "VECTORS" in splitup:
                    field = splitup[1]
                    data = np.fromfile(f, dtype=">f4", count=3 * grid_ncells)
                    data_x = data[0::3].reshape(grid_dims, order="F")
                    data_y = data[1::3].reshape(grid_dims, order="F")
                    data_z = data[2::3].reshape(grid_dims, order="F")
                    if i == 0:
                        self.fields.append(field + "_x")
                        self.fields.append(field + "_y")
                        self.fields.append(field + "_z")

                    # print('writing field %s' % field)
                    self.write_gdf_field(gdf_name, i, field + "_x", data_x)
                    self.write_gdf_field(gdf_name, i, field + "_y", data_y)
                    self.write_gdf_field(gdf_name, i, field + "_z", data_z)
                    del data, data_x, data_y, data_z
                del line
                line = f.readline()
            f.close()
            del f

        f = self.handle
        field_g = f["field_types"]
        # Add Field Attributes
        for name in self.fields:
            tname = name
            try:
                tname = translation_dict[name]
            except Exception:
                pass
            this_field = field_g.create_group(tname)
            if name in self.field_conversions.keys():
                this_field.attrs["field_to_cgs"] = self.field_conversions[name]
            else:
                this_field.attrs["field_to_cgs"] = np.float64("1.0")  # For Now



[docs]
    def convert(self, index=True, data=True):
        self.handle = h5py.File(self.outname, mode="a")
        if index:
            self.read_and_write_index(self.basename, self.ddn, self.outname)
        if data:
            self.read_and_write_data(self.basename, self.ddn, self.outname)
        self.handle.close()





[docs]
class AthenaConverter(Converter):
    def __init__(self, basename, outname=None, field_conversions=None):
        self.fields = []
        self.basename = basename
        name = basename.split(".")
        fn = "%s.%04i" % (name[0], int(name[1]))
        self.ddn = int(name[1])
        self.basename = fn
        if outname is None:
            outname = fn + ".gdf"
        self.outname = outname
        if field_conversions is None:
            field_conversions = {}
        self.field_conversions = field_conversions


[docs]
    def parse_line(self, line, grid):
        # grid is a dictionary
        splitup = line.strip().split()
        if "vtk" in splitup:
            grid["vtk_version"] = splitup[-1]
        elif "Really" in splitup:
            grid["time"] = splitup[-1]
        elif "DIMENSIONS" in splitup:
            grid["dimensions"] = np.array(splitup[-3:], dtype="int64")
        elif "ORIGIN" in splitup:
            grid["left_edge"] = np.array(splitup[-3:], dtype="float64")
        elif "SPACING" in splitup:
            grid["dds"] = np.array(splitup[-3:], dtype="float64")
        elif "CELL_DATA" in splitup:
            grid["ncells"] = int(splitup[-1])
        elif "SCALARS" in splitup:
            field = splitup[1]
            grid["read_field"] = field
            grid["read_type"] = "scalar"
        elif "VECTORS" in splitup:
            field = splitup[1]
            grid["read_field"] = field
            grid["read_type"] = "vector"



[docs]
    def read_grid(self, filename):
        """Read Athena legacy vtk file from single cpu"""
        f = open(filename, "rb")
        # print('Reading from %s'%filename)
        grid = {}
        grid["read_field"] = None
        grid["read_type"] = None
        table_read = False
        line = f.readline()
        while line != "":
            while grid["read_field"] is None:
                self.parse_line(line, grid)
                if grid["read_type"] == "vector":
                    break
                if not table_read:
                    line = f.readline()
                if "TABLE" in line.strip().split():
                    table_read = True
                if len(line) == 0:
                    break

            if len(line) == 0:
                break
            if np.prod(grid["dimensions"]) != grid["ncells"]:
                grid["dimensions"] -= 1
            if np.prod(grid["dimensions"]) != grid["ncells"]:
                print(
                    "product of dimensions %i not equal to number of cells %i"
                    % (np.prod(grid["dimensions"]), grid["ncells"])
                )
                raise TypeError

            if grid["read_type"] == "scalar":
                grid[grid["read_field"]] = np.fromfile(
                    f, dtype=">f4", count=grid["ncells"]
                ).reshape(grid["dimensions"], order="F")
                self.fields.append(grid["read_field"])
            elif grid["read_type"] == "vector":
                data = np.fromfile(f, dtype=">f4", count=3 * grid["ncells"])
                grid[grid["read_field"] + "_x"] = data[0::3].reshape(
                    grid["dimensions"], order="F"
                )
                grid[grid["read_field"] + "_y"] = data[1::3].reshape(
                    grid["dimensions"], order="F"
                )
                grid[grid["read_field"] + "_z"] = data[2::3].reshape(
                    grid["dimensions"], order="F"
                )
                self.fields.append(grid["read_field"] + "_x")
                self.fields.append(grid["read_field"] + "_y")
                self.fields.append(grid["read_field"] + "_z")
            else:
                raise TypeError
            grid["read_field"] = None
            grid["read_type"] = None
            line = f.readline()
            if len(line) == 0:
                break
        grid["right_edge"] = grid["left_edge"] + grid["dds"] * (grid["dimensions"])
        return grid



[docs]
    def write_to_gdf(self, fn, grid):
        f = h5py.File(fn, mode="a")

        ## --------- Begin level nodes --------- ##
        g = f.create_group("gridded_data_format")
        g.attrs["format_version"] = np.float32(1.0)
        g.attrs["data_software"] = "athena"
        data_g = f.create_group("data")
        field_g = f.create_group("field_types")
        f.create_group("particle_types")
        pars_g = f.create_group("simulation_parameters")

        dle = grid["left_edge"]  # True only in this case of one grid for the domain
        gles = np.array([grid["left_edge"]])
        gdims = np.array([grid["dimensions"]])
        glis = ((gles - dle) / grid["dds"]).astype("int64")

        # grid_left_index
        f.create_dataset("grid_left_index", data=glis)
        # grid_dimensions
        f.create_dataset("grid_dimensions", data=gdims)

        levels = np.array([0], dtype="int64")  # unigrid example
        # grid_level
        f.create_dataset("grid_level", data=levels)

        ## ----------QUESTIONABLE NEXT LINE--------- ##
        # This data needs two dimensions for now.
        n_particles = np.array([[0]], dtype="int64")
        # grid_particle_count
        f.create_dataset("grid_particle_count", data=n_particles)

        # Assume -1 means no parent.
        parent_ids = np.array([-1], dtype="int64")
        # grid_parent_id
        f.create_dataset("grid_parent_id", data=parent_ids)

        ## --------- Done with top level nodes --------- ##

        f.create_group("index")

        ## --------- Store Grid Data --------- ##

        g0 = data_g.create_group("grid_%010i" % 0)
        for field in self.fields:
            name = field
            if field in translation_dict.keys():
                name = translation_dict[name]
            if name not in g0.keys():
                g0.create_dataset(name, data=grid[field])

        ## --------- Store Particle Data --------- ##

        # Nothing to do

        ## --------- Attribute Tables --------- ##

        pars_g.attrs["refine_by"] = np.int64(1)
        pars_g.attrs["dimensionality"] = np.int64(3)
        pars_g.attrs["domain_dimensions"] = grid["dimensions"]
        try:
            pars_g.attrs["current_time"] = grid["time"]
        except Exception:
            pars_g.attrs["current_time"] = 0.0
        pars_g.attrs["domain_left_edge"] = grid["left_edge"]  # For Now
        pars_g.attrs["domain_right_edge"] = grid["right_edge"]  # For Now
        pars_g.attrs["unique_identifier"] = "athenatest"
        pars_g.attrs["cosmological_simulation"] = np.int64(0)
        pars_g.attrs["num_ghost_zones"] = np.int64(0)
        pars_g.attrs["field_ordering"] = np.int64(0)
        pars_g.attrs["boundary_conditions"] = np.int64([0] * 6)  # For Now

        # Extra pars:
        pars_g.attrs["n_cells"] = grid["ncells"]
        pars_g.attrs["vtk_version"] = grid["vtk_version"]

        # Add Field Attributes
        for name in g0.keys():
            tname = name
            try:
                tname = translation_dict[name]
            except Exception:
                pass
            this_field = field_g.create_group(tname)
        if name in self.field_conversions.keys():
            this_field.attrs["field_to_cgs"] = self.field_conversions[name]
        else:
            this_field.attrs["field_to_cgs"] = np.float64("1.0")  # For Now

        # Add particle types
        # Nothing to do here

        # Add particle field attributes
        f.close()



[docs]
    def convert(self):
        grid = self.read_grid(self.basename + ".vtk")
        self.write_to_gdf(self.outname, grid)




# import sys
# if __name__ == '__main__':
#     n = sys.argv[-1]
#     n = n.split('.')
#     fn = '%s.%04i'%(n[0],int(n[1]))
#     grid = read_grid(fn+'.vtk')
#     write_to_hdf5(fn+'.gdf',grid)