Source code for aiida_spirit.parsers

# -*- coding: utf-8 -*-
"""
Parsers provided by aiida_spirit.

Register parsers via the "aiida.parsers" entry point in setup.json.
"""
import pathlib
import numpy as np
from aiida.engine import ExitCode
from aiida.parsers.parser import Parser
from aiida.plugins import CalculationFactory
from aiida.common import exceptions
from aiida.orm import Dict, ArrayData
from masci_tools.io.common_functions import search_string
from .calculations import _RETLIST, _SPIRIT_STDOUT, _ATOM_TYPES

SpiritCalculation = CalculationFactory('spirit')


[docs]class SpiritParser(Parser):
    """
    Parser class for parsing output of calculation.
    """
[docs]    def __init__(self, node):
        """
        Initialize Parser instance

        Checks that the ProcessNode being passed was produced by a SpiritCalculation.

        :param node: ProcessNode of calculation
        :param type node: :class:`aiida.orm.ProcessNode`
        """
        super(SpiritParser, self).__init__(node)  # pylint: disable=super-with-arguments
        if not issubclass(node.process_class, SpiritCalculation):
            raise exceptions.ParsingError('Can only parse SpiritCalculation')

[docs]    def parse(self, **kwargs):
        """
        Parse outputs, store results in database.

        :returns: an exit code, if parsing fails (or nothing if parsing succeeds)
        """

        # Check that folder content is as expected and needed for parsing
        files_retrieved = self.retrieved.list_object_names()
        files_expected = _RETLIST + [
            '_scheduler-stdout.txt', '_scheduler-stderr.txt'
        ]
        # Note: set(A) <= set(B) checks whether A is a subset of B
        if not set(files_expected) <= set(files_retrieved):
            self.logger.error("Found files '{}', expected to find '{}'".format(
                files_retrieved, files_expected))
            return self.exit_codes.ERROR_MISSING_OUTPUT_FILES

        # parse information from output file (number of iterations, convergence info, ...)
        retrieved_dict = self.parse_retrieved()

        # parse files in temporary folder
        # these files are not kept in the file repository but become numy arrays and are stored as ArrayData output nodes
        retrieved_temporary_folder = kwargs.get('retrieved_temporary_folder',
                                                None)
        if retrieved_temporary_folder is not None:
            retrieved_dict = self.parse_temporary_retrieved(
                retrieved_dict, retrieved_temporary_folder)

        for key, value in retrieved_dict.items():
            self.out(key, value)

        # check consistency of spirit_version_info with the inputs
        output_node = retrieved_dict['output_parameters']
        if 'pinning' in self.node.inputs:
            version_info = output_node['spirit_version_info']
            if not 'enabled' in version_info['Pinning']:
                return self.exit_codes.ERROR_SPIRIT_CODE_INCOMPATIBLE
        if 'defects' in self.node.inputs:
            version_info = output_node['spirit_version_info']
            if not 'enabled' in version_info['Defects']:
                return self.exit_codes.ERROR_SPIRIT_CODE_INCOMPATIBLE

        return ExitCode(0)

[docs]    def _parse_if_found(self, filename, *args, folder=None, **kwargs):
        """Parses a file and loads it with `np.loadtxt`.
        The `*args` and `**kwargs` are passed to `np.loadtxt`.
        If the file is not found it returns None."""
        if folder is None:
            folder = self.retrieved
            if filename in folder.list_object_names():
                with folder.open(filename, 'r') as _f:
                    return np.loadtxt(_f, *args, **kwargs)
            else:
                return self._file_not_found(filename)
        else:
            filenames = [f.name for f in folder.glob('*')]
            if filename in filenames:
                with (folder / filename).open('r') as _f:
                    return np.loadtxt(_f, *args, **kwargs)
            else:
                return self._file_not_found(filename)

[docs]    def _file_not_found(self, filename):
        self.logger.info('{} not found!'.format(filename))

[docs]    def parse_retrieved(self):  # pylint: disable=too-many-locals
        """Parse the output from the retrieved and create aiida nodes"""

        retrieved = self.retrieved

        # parse info from stdout
        output_filename = _SPIRIT_STDOUT
        self.logger.info("Parsing '{}'".format(output_filename))
        with retrieved.open(output_filename, 'r') as _f:
            txt = _f.readlines()
        out_dict = parse_outfile(txt)
        output_node = Dict(dict=out_dict)

        # parse output files
        self.logger.info('Parsing atom types')
        atyp = self._parse_if_found(_ATOM_TYPES)

        # Write dictionary of retrieved quantities
        _retrieved_dict = {'output_parameters': output_node}

        # collect arrays in ArrayData
        if atyp is not None:
            atypes = ArrayData()
            atypes.set_array('atom_types', atyp)
            atypes.extras['description'] = {
                'atom_types': 'list of atom types for all positions',
            }
            _retrieved_dict.update({'atom_types': atypes})

        return _retrieved_dict

[docs]    def parse_temporary_retrieved(self, _retrieved_dict,
                                  retrieved_temporary_folder):
        """Parse files that are defined in the retrieve_temporary_list"""
        retrieved_temporary_folder = pathlib.Path(retrieved_temporary_folder)

        self.logger.info('Parsing energy archive')
        energ = self._parse_if_found('spirit_Image-00_Energy-archive.txt',
                                     folder=retrieved_temporary_folder,
                                     skiprows=1)

        self.logger.info('Parsing initial magnetization')
        m_init = self._parse_if_found('spirit_Image-00_Spins-initial.ovf',
                                      folder=retrieved_temporary_folder)

        self.logger.info('Parsing final magnetization')
        m_final = self._parse_if_found('spirit_Image-00_Spins-final.ovf',
                                       folder=retrieved_temporary_folder)

        self.logger.info('Parsing MC output')
        out_mc = self._parse_if_found('output_mc.txt',
                                      folder=retrieved_temporary_folder)

        if m_init is not None and m_final is not None:
            mag = ArrayData()
            mag.set_array(
                'initial',
                np.nan_to_num(m_init))  # nan_to_num is needed with defects
            mag.set_array('final', np.nan_to_num(m_final))
            mag.extras['description'] = {
                'initial': 'initial directions of the magnetization vectors',
                'final': 'final directions of the magnetization vectors',
            }
            _retrieved_dict.update({'magnetization': mag})

        if energ is not None:
            energies = ArrayData()
            energies.set_array('energies', energ)
            energies.extras['description'] = {
                'energies': 'Energy convergence with iterations.',
            }
            _retrieved_dict.update({'energies': energies})

        # Only add mc if it is found
        if out_mc is not None:
            output_mc = ArrayData()

            # Associante the columns of out_mc with individual arrays
            array_names = [
                'temperature', 'energy', 'magnetization', 'susceptibility',
                'specific_heat', 'binder_cumulant'
            ]
            for i, name in enumerate(array_names):
                output_mc.set_array(name, out_mc[:, i])

            output_mc.extras['description'] = {
                'temperature':
                'The temperature at which the sampling was performed',
                'energy':
                'The average energy at the sampled temperature',
                'magnetization':
                'The average spin direction at the sample temperature',
                'susceptibility':
                'The susceptibility at the sampled temperature',
                'specific_heat':
                'The specific heat at the sampled temperature',
                'binder_cumulant':
                'The binder_cumulant at the sampled temperature',
            }
            _retrieved_dict.update({'monte_carlo': output_mc})

        return _retrieved_dict


[docs]def parse_outfile(txt):
    """parse the spirit output file"""

    out_dict = {}

    itmp = search_string('Total duration', txt)
    if itmp >= 0:
        t_str = txt[itmp].split()[2]
        tmp = [float(i) for i in t_str.split(':')]
        t_sec = tmp[0] * 3600 + tmp[1] * 60 + tmp[2]
        out_dict['runtime'] = t_str
        out_dict['runtime_sec'] = t_sec

    itmp = search_string('Iterations / sec', txt)
    if itmp >= 0:
        tmp = txt[itmp].split()[-1]
        it_per_s = float(tmp)
        out_dict['it_per_s'] = it_per_s

    itmp = search_string('Simulated time', txt)
    if itmp >= 0:
        tmp = txt[itmp].split()
        sim_time = float(tmp[-2])
        sim_time_unit = tmp[-1]
        out_dict['simulation_time'] = sim_time
        out_dict['simulation_time_unit'] = sim_time_unit

    itmp = search_string('Number of  Errors', txt)
    if itmp >= 0:
        tmp = txt[itmp].split()
        num_errors = int(tmp[-1])
        out_dict['num_errors'] = num_errors

    itmp = search_string('Number of Warnings', txt)
    if itmp >= 0:
        tmp = txt[itmp].split()
        num_warn = int(tmp[-1])
        out_dict['num_warnings'] = num_warn

    itmp = search_string('Terminated', txt)
    if itmp >= 0:
        tmp = txt[itmp].split()
        out_dict['simulation_mode'] = tmp[-3]

    itmp = search_string('Solver:', txt)
    if itmp >= 0:
        tmp = txt[itmp].split()
        out_dict['solver'] = tmp[-1]

    # parse information on the spirit executable (i.e. check parallelization and enabled features)
    spirit_version_info = {}
    for key in [
            'Version', 'Revision', 'OpenMP', 'CUDA', 'std::thread', 'Defects',
            'Pinning', 'scalar type'
    ]:
        itmp = search_string(key, txt)
        if itmp >= 0:
            found_str = txt[itmp].replace('==========', '').replace('  ', '')
            if found_str[0] == ' ':
                found_str = found_str[1:-1]
            spirit_version_info[key] = found_str
    out_dict['spirit_version_info'] = spirit_version_info

    return out_dict