<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE article
  PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.1 20151215//EN" "https://jats.nlm.nih.gov/publishing/1.1/JATS-journalpublishing1.dtd">
<article article-type="research-article" dtd-version="1.1" specific-use="sps-1.9" xml:lang="en" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink">
	<front>
		<journal-meta>
			<journal-id journal-id-type="publisher-id">teclo</journal-id>
			<journal-title-group>
				<journal-title>TecnoLógicas</journal-title>
				<abbrev-journal-title abbrev-type="publisher">TecnoL.</abbrev-journal-title>
			</journal-title-group>
			<issn pub-type="ppub">0123-7799</issn>
			<issn pub-type="epub">2256-5337</issn>
			<publisher>
				<publisher-name>Instituto Tecnológico Metropolitano - ITM</publisher-name>
			</publisher>
		</journal-meta>
		<article-meta>
<article-id pub-id-type="other">207</article-id> 
			<article-id pub-id-type="doi">10.22430/22565337.3052</article-id>
			<article-categories>
				<subj-group subj-group-type="heading">
					<subject>Research article</subject>
				</subj-group>
			</article-categories>
			<title-group>
				<article-title>Postcontrast Medical Image Synthesis in Breast DCE-MRI Using Deep Learning</article-title>
			</title-group>
			<contrib-group>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0001-5861-6148</contrib-id>
					<name>
						<surname>Cañaveral</surname>
						<given-names>Sara</given-names>
					</name>
					<xref ref-type="aff" rid="aff1"><sup>1</sup></xref>
					<xref ref-type="aff" rid="aff1">*</xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0002-6513-3053</contrib-id>
					<name>
						<surname>Mera-Banguero</surname>
						<given-names>Carlos</given-names>
					</name>
					<xref ref-type="aff" rid="aff2"><sup>2</sup></xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">0000-0001-6589-1981</contrib-id>
					<name>
						<surname>Fonnegra</surname>
						<given-names>Rubén D.</given-names>
					</name>
					<xref ref-type="aff" rid="aff3"><sup>3</sup></xref>
				</contrib>
			</contrib-group>
			<aff id="aff1">
				<label>1</label>
				<institution content-type="original">. Instituto Tecnológico Metropolitano, Medellín-Colombia; saracanaveral207005@correo.itm.edu.co</institution>
				<institution content-type="normalized">Instituto Tecnológico Metropolitano</institution>
				<institution content-type="orgname">Instituto Tecnológico Metropolitano</institution>
				<addr-line>
					<city>Medellín</city>
				</addr-line>
				<country country="CO">Colombia</country>
				<email>saracanaveral207005@correo.itm.edu.co</email>
			</aff>
			<aff id="aff2">
				<label>2</label>
				<institution content-type="original">. Instituto Tecnológico Metropolitano; Universidad de Antioquia, Medellín-Colombia; carlos.mera@udea.edu.co</institution>
				<institution content-type="normalized">Instituto Tecnológico Metropolitano</institution>
				<institution content-type="orgname">Instituto Tecnológico Metropolitano; Universidad de Antioquia</institution>
				<addr-line>
					<city>Medellín</city>
				</addr-line>
				<country country="CO">Colombia</country>
				<email>carlos.mera@udea.edu.co</email>
			</aff>
			<aff id="aff3">
				<label>3</label>
				<institution content-type="original">. Institución Universitaria Pascual Bravo, Medellín-Colombia; ruben.fonnegra@pascualbravo.edu.co</institution>
				<institution content-type="normalized">Instituto Tecnológico Pascual Bravo</institution>
				<institution content-type="orgname">Institución Universitaria Pascual Bravo</institution>
				<addr-line>
					<city>Medellín</city>
				</addr-line>
				<country country="CO">Colombia</country>
				<email>ruben.fonnegra@pascualbravo.edu.co</email>
			</aff>
			<author-notes>
				<corresp id="c1">
					<label>*</label>
					<email>saracanaveral207005@correo.itm.edu.co</email>
				</corresp>
				<fn fn-type="conflict" id="fn2">
					<p>The authors declare no conflicts of interest.</p>
				</fn>
				<fn fn-type="equal" id="fn3">
					<label>Sara Cañaveral:</label>
					<p> Designed and conducted the experiments, analyzed and interpreted the data, drafted the manuscript, and contributed to its final revision.</p>
				</fn>
				<fn fn-type="equal" id="fn4">
					<label>Rubén Fonnegra: </label>
					<p>Designed the experiments, analyzed and interpreted the data, and participated in both partial and final revisions of the manuscript.</p>
				</fn>
				<fn fn-type="equal" id="fn5">
					<label>Carlos Mera-Banguero:</label>
					<p> Designed the experiments, analyzed and interpreted the data, and participated in both partial and final revisions of the manuscript. Initially engaged as a professor at the Instituto Tecnológico Metropolitano (ITM), he completed his contributions while affiliated with the Universidad de Antioquia in Medellín, Colombia.</p>
				</fn>
			</author-notes>
			<pub-date date-type="pub" publication-format="electronic">
				<day>26</day>
				<month>11</month>
				<year>2024</year>
			</pub-date>
			<pub-date date-type="collection" publication-format="electronic">
				<season>May-Aug</season>
				<year>2024</year>
			</pub-date>
			<volume>27</volume>
			<issue>60</issue>
			<elocation-id>e207</elocation-id>
			<history>
				<date date-type="received">
					<day>03</day>
					<month>04</month>
					<year>2024</year>
				</date>
				<date date-type="accepted">
					<day>16</day>
					<month>07</month>
					<year>2024</year>
				</date>
			</history>
			<permissions>
				<license license-type="open-access" xlink:href="https://creativecommons.org/licenses/by-nc-sa/4.0/" xml:lang="en">
					<license-p>This is an open-access article distributed under the terms of the Creative Commons Attribution License</license-p>
				</license>
			</permissions>
			<abstract>
				<title>Abstract</title>
				<p>Breast cancer is one of the leading causes of death in women in the world, so its early detection has become a priority to save lives. For the diagnosis of this type of cancer, there are techniques such as dynamic contrast-enhanced magnetic resonance imaging (DCE-MRI), which uses a contrast agent to enhance abnormalities in breast tissue, which improves the detection and characterization of possible tumors. As a limitation, DCE-MRI studies are usually expensive, there is little equipment available to perform them, and in some cases the contrast medium can generate adverse effects due to an allergic reaction. Considering all of the above, the aim of this work was to use deep learning models for the generation of postcontrast synthetic images in DCE-MRI studies. The proposed methodology consisted of the development of a cost function, called CeR-Loss, that takes advantage of the contrast agent uptake behavior. As a result, two new deep learning architectures were trained, which we have named G-RiedGAN and D-RiedGAN, for the generation of postcontrast images in DCE-MRI studies, from precontrast images. Finally, it is concluded that the peak signal-to-noise ratio, structured similarity indexing method, and mean absolute error metrics show that the proposed architectures improve the postcontrast image synthesis process, preserving greater similarity between the synthetic images and the real images, compared to the state-of-the-art base models.</p>
			</abstract>
			<kwd-group xml:lang="en">
				<title>Keywords:</title>
				<kwd>Breast cancer</kwd>
				<kwd>diagnostic imaging</kwd>
				<kwd>magnetic resonance imaging</kwd>
				<kwd>postcontrast image generation</kwd>
				<kwd>deep learning</kwd>
			</kwd-group>
			<counts>
				<fig-count count="11"/>
				<table-count count="2"/>
				<equation-count count="26"/>
				<ref-count count="43"/>
				<page-count count="20"/>
			</counts>
		</article-meta>
	</front>
	<body>
		<sec sec-type="intro">
			<title>1. INTRODUCTION</title>
			<p>Breast cancer is a chronic non-communicable disease caused by DNA alterations that affect the normal division and growth of tissue cells. Due to its high incidence rates-particularly among the female population-it is one of the major public health concerns worldwide <sup>[</sup><xref ref-type="bibr" rid="B1"><sup>1</sup></xref><sup>].</sup> Moreover, it is a leading cause of cancer-related deaths globally <sup>[</sup><xref ref-type="bibr" rid="B2"><sup>2</sup></xref><sup>].</sup> According to the Global Cancer Observatory (GLOBOCAN), breast cancer accounted for 11.5 % of new cancer cases around the world in 2022 <sup>[</sup><xref ref-type="bibr" rid="B3"><sup>3</sup></xref><sup>].</sup></p>
			<p>In general terms, breast cancer can be classified into five main types <sup>[</sup><xref ref-type="bibr" rid="B4"><sup>4</sup></xref><sup>].</sup> The first type, Lobular Carcinoma in Situ (LCIS), is a benign condition occurring in the breast lobules that does not spread outside of them. The second type, Ductal Carcinoma in Situ (DCIS), is a noninvasive neoplasm that develops in the milk glands or ducts without spreading beyond them. The third type, Infiltrating Ductal Carcinoma (IDC), begins in the ducts and may spread to surrounding breast tissues. The fourth type, Infiltrating Lobular Carcinoma (ILC), originates in the breast lobules and is often more challenging to detect due to its tendency to spread in a scattered manner rather than forming a lump. The fifth type, inflammatory breast cancer, is a rare and aggressive form that typically presents as redness, swelling, and warmth in the breast rather than a lump. It requires immediate treatment due to its rapid spread.</p>
			<p>The treatment and prognosis of breast cancer depend on its type and specific characteristics. Nevertheless, early detection and timely treatment are crucial for preventing complications, improving patient prognosis, and reducing mortality rates <sup>[</sup><xref ref-type="bibr" rid="B5"><sup>5</sup></xref><sup>].</sup> Among the most commonly used methods for breast cancer detection are mammography and breast ultrasound. Mammography involves using low-dose X-rays to visualize internal breast tissues and is considered the standard detection method due to its low cost and ease of use <sup>[</sup><xref ref-type="bibr" rid="B6"><sup>6</sup></xref><sup>].</sup> However, it is only recommended for patients over 40 years of age and is contraindicated in pregnant women or in follow-ups due to radiation exposure. In contrast, ultrasound employs sound waves to visualize breast tissue <sup>[</sup><xref ref-type="bibr" rid="B7"><sup>7</sup></xref><sup>]</sup>, but it is highly dependent on the operator’s expertise. Furthermore, both methods may be ineffective in patients with dense breast tissue <sup>[</sup><xref ref-type="bibr" rid="B6"><sup>6</sup></xref><sup>], [</sup><xref ref-type="bibr" rid="B8"><sup>8</sup></xref><sup>].</sup></p>
			<p>When mammography or ultrasound results are inconclusive, more specialized tests are employed, which involve the intravenous administration of a contrast agent <sup>[</sup><xref ref-type="bibr" rid="B9"><sup>9</sup></xref><sup>].</sup> This chemical compound highlights cancer cells in the breast tissue by leveraging their elevated metabolic activity. Three such tests are Contrast-Enhanced Digital Mammography (CEDM), Dynamic Contrast-Enhanced Magnetic Resonance Imaging (DCE-MRI), and Contrast-Enhanced Ultrasound (CEUS). CEDM requires taking two X-ray images of the breast: one before the administration of the contrast agent, employing low radiation levels (conventional mammography); and another after the application of the contrast agent, using high radiation. The two images are subsequently combined to create a recombined image, which highlights regions where the contrast agent has been absorbed in the tissue <sup>[</sup><xref ref-type="bibr" rid="B10"><sup>10</sup></xref><sup>].</sup></p>
			<p>For its part, DCE-MRI uses magnetic waves to capture the absorption of the contrast agent over time, as it reacts in an accelerated manner in tissues with potential lesions <sup>[</sup><xref ref-type="bibr" rid="B11"><sup>11</sup></xref><sup>].</sup> To this end, the system takes a series of initial images of both breasts before the contrast agent is administered, followed by a series of images after its administration. This method is more sensitive and provides more accurate information about the state of the breast and any possible lesions, thus enabling the characterization of potential tumors. Regarding CEUS, it employs an intravascular contrast agent that allows real-time assessment of microcirculation and vascular and tissue perfusion <sup>[</sup><xref ref-type="bibr" rid="B12"><sup>12</sup></xref><sup>].</sup></p>
			<p>Despite their advantages, these methods have limitations that include elevated costs, long acquisition times, and limited availability of equipment. Additionally, the contrast agent may cause allergic or adverse reactions in patients <sup>[</sup><xref ref-type="bibr" rid="B13"><sup>13</sup></xref><sup>].</sup> In the search for solutions to these setbacks, numerous studies have demonstrated the potential of deep learning neural networks to generate synthetic images that replicate the effect of the contrast agent without actually using it <sup>[</sup><xref ref-type="bibr" rid="B14"><sup>14</sup></xref><sup>]-[</sup><xref ref-type="bibr" rid="B18"><sup>18</sup></xref><sup>],</sup> while maintaining the visual quality of the images. On this background, the present study proposes a novel cost function, called Contrast-enhanced Region Loss (CeR-Loss), which leverages the contrast agent uptake behavior to generate synthetic post-contrast images from pre-contrast images in DCE-MRI studies. This function is employed in two new deep learning architectures, G-RiedGAN and D-RiedGAN, which focus on contrast-enhanced regions to improve the generation of synthetic post-contrast images.</p>
		</sec>
		<sec>
			<title>2. LITERATURE REVIEW</title>
			<p>Deep learning is a branch of machine learning that relies on artificial networks, which consist of interconnected layers of artificial neurons that can self-adjust based on the input and the amount of data they process <sup>[</sup><xref ref-type="bibr" rid="B19"><sup>19</sup></xref><sup>].</sup> One of the application areas of deep learning networks is image synthesis, which involves generating artificial images from a visual or textual description of their content. In the medical field, image synthesis has been employed, for example, for augmenting datasets to train models for disease diagnosis <sup>[</sup><xref ref-type="bibr" rid="B20"><sup>20</sup></xref><sup>];</sup> improving image resolution in specific imaging modalities <sup>[</sup><xref ref-type="bibr" rid="B21"><sup>21</sup></xref><sup>];</sup> segmenting regions of interest within images <sup>[</sup><xref ref-type="bibr" rid="B22"><sup>22</sup></xref><sup>];</sup> and generating images from data obtained through another examination modality <sup>[</sup><xref ref-type="bibr" rid="B23"><sup>23</sup></xref><sup>].</sup> The importance of image synthesis in medicine lies in its potential to enhance diagnostic accuracy, reduce the time and cost of capturing diagnostic images, and expand the availability of these medical examinations <sup>[</sup><xref ref-type="bibr" rid="B24"><sup>24</sup></xref><sup>].</sup></p>
			<p>Image synthesis models can be broadly classified into two categories: autoencoders and Generative Adversarial Networks (GANs). Autoencoders, on the one hand, are architectures that comprise an encoder, which reduces the dimensionality of input data to learn an abstract (or latent) representation of its distribution; and a decoder, which reconstructs information from the latent space into a higher-dimensional space <sup>[</sup><xref ref-type="bibr" rid="B25"><sup>25</sup></xref><sup>].</sup> A variation of autoencoders, known as U-Net, addresses the information loss problem by copying information from the encoder layers to the decoder layers, thus improving the reconstruction of information in the higher-dimensional space <sup>[</sup><xref ref-type="bibr" rid="B25"><sup>25</sup></xref><sup>], [</sup><xref ref-type="bibr" rid="B26"><sup>26</sup></xref><sup>].</sup></p>
			<p>GANs, on the other hand, consist of a generator and a discriminator. The generator is a convolutional network that attempts to learn the latent distribution of the real data to generate synthetic information from a random noise sample. For its part, the discriminator is a complementary convolutional network that acts as an expert in distinguishing between real and synthetic information. The training of both networks is adversarial, that is, the generator strives to enhance its generation process to deceive the discriminator, while the discriminator seeks to refine its expertise to avoid being deceived by the generator. This adversarial learning process gives GANs their name <sup>[</sup><xref ref-type="bibr" rid="B27"><sup>27</sup></xref><sup>].</sup></p>
			<p>Image synthesis methods can be employed to generate post-contrast images from pre-contrast images in DCE-MRI and CEDM studies. This application, known as domain shift, entails transforming a pre-contrast image (x) into a post-contrast image (y) <sup>[</sup><xref ref-type="bibr" rid="B21"><sup>21</sup></xref><sup>], [</sup><xref ref-type="bibr" rid="B23"><sup>23</sup></xref><sup>].</sup> In this line, the authors of <sup>[</sup><xref ref-type="bibr" rid="B15"><sup>15</sup></xref><sup>]</sup> trained a shallow generative architecture called SD-CNN to generate synthetic patches of post-contrast recombined images in CEDM studies from patches of full-field digital mammography images. In this study, two independent image repositories were used to extract the patches. The first dataset is INbreast <sup>[</sup><xref ref-type="bibr" rid="B28"><sup>28</sup></xref><sup>],</sup> a public database from which 89 studies with BI-RADS categories 1 and 2 (benign) and 5 and 6 (malignant) were taken. The second database is proprietary and contains 49 studies with BI-RADS categories 4 and 5. All results were confirmed by biopsy, resulting in 23 benign and 26 malignant cases. The authors noted that using synthetic patches generated with their architecture improved the accuracy of mammography patch classifiers. However, a limitation of this architecture is that it is only capable of generating 3x3 synthetic patches from 15x15-pixel patches, which restricts its use in full image synthesis. Moreover, the shallowness of the network leads to few levels of abstraction, thus reducing its ability to synthesize complex structures such as those defining breast tissues. </p>
			<p>In a subsequent study, the authors proposed a U-Net architecture called RiedNet <sup>[</sup><xref ref-type="bibr" rid="B29"><sup>29</sup></xref><sup>].</sup> This architecture introduced several modifications, including replacing pooling layers with convolutional and deconvolutional layers and incorporating a residual inception block to address the gradient fading problem caused by the network’s depth. The purpose of RiedNet was the synthetic generation of images in the medical context and its evaluation involved obtaining post-contrast recombined images of CEDM studies from low-energy images. Nevertheless, since the network was trained to synthesize 128x128-pixel blocks, the complete image synthesis considered the average of the generated blocks, potentially resulting in a blurring effect on the reconstructed breast tissues. In this case, the experiments were conducted on 139 contrasted mammography studies, with 112 used for training and 27 for testing.</p>
			<p>Regarding the use of DCE-MRI studies for breast cancer detection, the authors of <sup>[</sup><xref ref-type="bibr" rid="B30"><sup>30</sup></xref><sup>]</sup> employed a conditional GAN architecture called Pix2Pix <sup>[</sup><xref ref-type="bibr" rid="B31"><sup>31</sup></xref><sup>],</sup> designed to generate fat-suppressed T1-weighted contrast-enhanced images from non-contrast images. The Pix2Pix architecture comprised a U-Net generator and a PatchGAN discriminator <sup>[</sup><xref ref-type="bibr" rid="B31"><sup>31</sup></xref><sup>].</sup> Particularly, the images used in this study were captured with a resolution of 3T and subsequently resized to 512x512 pixels. A total of 2,620 image pairs from 48 DCE-MRI studies were employed, with 2112 reserved for training, 418 for validation, and 90 for testing. Although the model tends to present errors in dense breast images, the authors emphasize the potential of the Pix2Pix architecture for synthetic generation of contrast-enhanced DCE-MRI images.</p>
			<p>Another contribution to this field is the study presented in <sup>[</sup><xref ref-type="bibr" rid="B17"><sup>17</sup></xref><sup>],</sup> which proposed a GAN architecture called TSGAN. TSGAN consists of four models: a U-Net model trained to generate post-contrast T1-weighted images from pre-contrast images; a global discriminator that focuses on differentiating real from fake post-contrast images; a local discriminator that distinguishes between real and fake regions of interest; and a U-Net model trained to generate segmentation masks over breast lesions. Similarly, in <sup>[</sup><xref ref-type="bibr" rid="B32"><sup>32</sup></xref><sup>],</sup> the authors introduced an architecture called EDLS to synthesize dynamic sequences from T1WI images in MRI studies, improving lesion identification without using a contrast agent. Likewise, the authors of <sup>[</sup><xref ref-type="bibr" rid="B33"><sup>33</sup></xref><sup>]</sup> explored the use of GAN architectures to generate realistic breast MRI images to enhance breast lesion detection. Additionally, in <sup>[</sup><xref ref-type="bibr" rid="B34"><sup>34</sup></xref><sup>],</sup> the authors employed a CycleGAN architecture to translate images between different domains without the need for matched data pairs, thereby raising the quality of the synthesized images.</p>
			<p>Furthermore, in <sup>[</sup><xref ref-type="bibr" rid="B35"><sup>35</sup></xref><sup>],</sup> the authors presented a TDM-StarGAN architecture designed to generate synthetic images of conventional DCE-MRI study phases from ultrafast DCE-MRI study images. To this end, the authors modified the StarGAN architecture <sup>[</sup><xref ref-type="bibr" rid="B29"><sup>29</sup></xref><sup>]</sup> for use with paired images. In addition, they considered the loss in the difference maps of the generated images and the detection area, obtained from the difference between the last post-contrast image and the pre-contrast image. They concluded that the proposed model outperformed the baseline models (Pix2Pix and StarGAN) by accurately synthesizing the regions associated with lesions.</p>
			<p>In other imaging modalities, the study presented in <sup>[</sup><xref ref-type="bibr" rid="B36"><sup>36</sup></xref><sup>]</sup> proposed the use of a Pix2Pix architecture to enhance the quality of low-count Positron Emission Tomography (dbPET) images, which is often compromised by patient respiration. Experiments were conducted on 49 cases, including 32 with abnormal results and 17 with normal results. To this end, each image was resized to 958x940 pixels. The authors posit that the Pix2Pix architecture can effectively address this problem by improving the quality of dbPET images with short acquisition times.</p>
			<p>Aiming at reducing the radiation doses used in breast cancer diagnostic tests, the authors of <sup>[</sup><xref ref-type="bibr" rid="B18"><sup>18</sup></xref><sup>]</sup> and <sup>[</sup><xref ref-type="bibr" rid="B37"><sup>37</sup></xref><sup>]</sup> trained various models to generate digital mammography images from tomosynthesis images. The authors introduced an architecture called GGGAN, which employs a U-Net generator and a variant of the Pix2PixHD discriminator. The loss function for GGGAN uses the difference maps of the gradients of the images generated in specific intermediate layers.</p>
			<p>In a context other than breast cancer diagnosis, the authors of <sup>[</sup><xref ref-type="bibr" rid="B38"><sup>38</sup></xref><sup>]</sup> designed an architecture based on Pix2Pix, called Ea-GAN. It included the difference maps of the edges of the generated and real images in the loss function of both the discriminator and the generator. This inclusion aimed to enhance the synthesis of these elements and mitigate the smoothing effect commonly observed in U-Net networks <sup>[</sup><xref ref-type="bibr" rid="B14"><sup>14</sup></xref><sup>].</sup> This study employed the BRATS2015 database <sup>[</sup><xref ref-type="bibr" rid="B39"><sup>39</sup></xref><sup>],</sup> which contains MRI images of 74 patients with a resolution of 240x240x155 voxels. The images were preprocessed and normalized with intensity values ranging from -1 to 1.</p>
			<p>Despite numerous attempts to develop generative models for synthesizing diagnostic images in breast cancer detection, there are still significant limitations. This is largely due to the high variability in breast tissue density, which affects the performance of generative models when using contrast agents, as the visibility of these agents diminishes with increasing pixel intensity.</p>
			<p>To address these challenges, this study proposes a novel architecture called D-RiedGAN. This architecture builds upon the Pix2Pix framework by incorporating residual inception blocks but focuses on contrast-enhanced regions in DCE-MRI studies.</p>
		</sec>
		<sec sec-type="methods">
			<title>3. METHODOLOGY</title>
			<p>The proposed methodology begins with the implementation of a three-model baseline to synthesize fat-saturated T1-weighted images showing early response to contrast medium in DCE-MRI studies. Building on this baseline, two mixed architectures and two new architectures (G-RiedGAN and D-RiedGAN) are developed. These generative models are trained to generate synthetic post-contrast images, 𝑦̂ = 𝐺(𝑥). from non-contrast images, <italic>x</italic>. The goal is for the generative model, 𝐺(𝑥), to learn the early response to the contrast medium, thereby making the synthetic images resemble the real post-contrast images (<italic>y</italic>).</p>
			<sec>
				<title>3.1 Optimization of contrast-enhanced regions</title>
				<p>Traditional models for image synthesis have achieved significant advancements in natural image processing but face multiple limitations, especially when applied to specialized images such as medical ones. To overcome these challenges, this study proposes integrating a cost function that captures information from contrast-enhanced regions during training. This function aims to guide the synthesis process to accurately generate contrast enhancement in post-contrast images.</p>
				<p>In terms of pixel intensity, the enhancement after contrast agent administration is identified by the highest intensities in the post-contrast image. Particularly, a global thresholding strategy, as shown in (<xref ref-type="disp-formula" rid="e1">1</xref>), is used to detect these high-intensity pixels. Here, <italic>y</italic>(<italic>i</italic>, <italic>j</italic>) is the pixel at position (i, j) in the post-contrast image and <italic>T</italic> is the threshold value.</p>
				<p>
					<disp-formula id="e1">
						<graphic xlink:href="2256-5337-teclo-27-60-e207-e1.png"/>
					</disp-formula>
				</p>
				<p>Due to the sensitivity of <italic>T</italic> to intensity variations in images from different DCE-MRI studies, this parameter is set for each image using the 90th percentile of its histogram. In other words, the 10 % of the image pixels with the highest intensities are retained as contrast-enhanced regions. To refine these regions, closing and opening operators are employed using a <italic>7x7</italic>-pixel circular structuring element, which smooths contours and removes small gaps between adjacent regions. This process is applied to both synthetic and real post-contrast images, generating real <italic>F</italic>
 <sub>
 <italic>y</italic>
</sub> and synthetic <italic>F</italic>
 <sub>
 <italic>G(x)</italic> 
</sub> contrast enhancement masks.</p>
				<p>Once the contrast-enhanced regions are identified, a cost function is used to minimize the discrepancies between these regions in real and synthetic images. Since contrast-enhanced regions are binary, optimizing them involves employing a cost function based on set similarity, such as the Jaccard index <sup>[</sup><xref ref-type="bibr" rid="B40"><sup>40</sup></xref><sup>].</sup> The Jaccard index between the real <italic>F</italic>
 <sub>
 <italic>y</italic> 
</sub> and generated (<italic>F</italic>
 <sub>
 <italic>G(x)</italic>
</sub> ) contrast regions is computed using (<xref ref-type="disp-formula" rid="e2">2</xref>).</p>
				<p>
					<disp-formula id="e2">
						<graphic xlink:href="2256-5337-teclo-27-60-e207-e2.png"/>
					</disp-formula>
				</p>
				<p>Because the Jaccard index is neither convex nor differentiable, its optimization via gradient descent (in the context of neural networks) can result in suboptimal solutions or convergence problems. <sup>[</sup><xref ref-type="bibr" rid="B41"><sup>41</sup></xref><sup>]</sup> recommend employing a convex approximation to derive an optimizable function from the discrete function, which can then be optimized by first-order methods like gradient descent. This approach, based on the Lovász surrogate approximation, is estimated from a set of erroneous predictions, 𝑚(𝑐) ∈ 𝑅<sup>𝑝</sup> for class 𝑐 ∈ 𝐶 rather than the vector of discrete predictions{0, 1}<sup>𝑝</sup>. Given that function ∆:{0, 1}<sup>𝑝 ↦ 𝑅𝑝</sup> is submodular (como la función 𝐽𝑐), its Lovász extension is defined by (<xref ref-type="disp-formula" rid="e3">3</xref>).</p>
				<p>
					<disp-formula id="e3">
						<graphic xlink:href="2256-5337-teclo-27-60-e207-e3.png"/>
					</disp-formula>
				</p>
				<p>Here, 𝑔<sub>𝑖</sub>(𝑚) = ∆({𝜋<sub>1</sub>. . . 𝜋<sub>𝑖</sub> }) − ∆({𝜋<sub>1</sub>. . . 𝜋<sub>𝑖−1</sub>}) with 𝜋 being a permutation of the components of 𝑚 in descending order. Function ∆̅ is the strict convex closure of ∆, is piecewise linear, and interpolates the values of ∆, in 𝑅<sup>𝑝</sup>. Equation (<xref ref-type="disp-formula" rid="e4">4</xref>) is employed to compute the Lovász function of the Jaccard index in (<xref ref-type="disp-formula" rid="e2">2</xref>) (∆̅ <sub>𝐽𝑐</sub>).</p>
				<p>
					<disp-formula id="e4">
						<graphic xlink:href="2256-5337-teclo-27-60-e207-e4.png"/>
					</disp-formula>
				</p>
				<p>Where𝑓(𝑦, 𝑦∗) estimates the error vector <italic>m</italic> from the real or generated contrast masks after applying the SoftMax function. To avoid variations caused by batch size and the number of classes, the Lovász function is optimized by combining it with the Binary Cross-Entropy (BCE) described in (<xref ref-type="disp-formula" rid="e5">5</xref>), as suggested by the authors of <sup>[</sup><xref ref-type="bibr" rid="B41"><sup>41</sup></xref><sup>].</sup></p>
				<p>
					<disp-formula id="e5">
						<graphic xlink:href="2256-5337-teclo-27-60-e207-e5.png"/>
					</disp-formula>
				</p>
				<p>Finally, to optimize the proposed models, a cost function combining BCE with the Lovász surrogate extension is used specifically for the contrast-enhanced regions. This combined function, termed CeR-Loss, is presented in (<xref ref-type="disp-formula" rid="e6">6</xref>).</p>
				<p>
					<disp-formula id="e6">
						<graphic xlink:href="2256-5337-teclo-27-60-e207-e6.png"/>
					</disp-formula>
				</p>
			</sec>
			<sec>
				<title>3.2 G-RiedGAN y D-RiedGAN</title>
				<p>
					<xref ref-type="fig" rid="f1">Figure 1</xref>a illustrates the general architecture of the first proposed model, G-RiedGAN. This architecture integrates, after the generator, a filter for detecting contrast-enhanced regions, which provides feedback to the generator to guide it in accurately replicating contrast enhancement. In this case, the PatchGAN discriminator, which identifies whether pre-contrast and post-contrast image pairs are real or synthetic, remains unchanged. The loss function of the G-RiedGAN generator, shown in (<xref ref-type="disp-formula" rid="e7">7</xref>), considers the overall loss from the pixel-level difference between the real and generated images, as well as the loss from the contrast-enhanced regions (CeR-Loss).</p>
				<p>
					<fig id="f1">
						<label>Figure 1</label>
						<caption>
							<title>G-RiedGAN and D-RiedGAN architectures</title>
						</caption>
						<graphic xlink:href="2256-5337-teclo-27-60-e207-gf1.jpg"/>
						<attrib>Source: Own work.</attrib>
					</fig>
				</p>
				<p>
					<disp-formula id="e7">
						<graphic xlink:href="2256-5337-teclo-27-60-e207-e7.png"/>
					</disp-formula>
				</p>
				<p>The proposed D-RiedGAN architecture, for its part, depicted in <xref ref-type="fig" rid="f1">Figure 1</xref>b, includes the difference between the contrast-enhanced regions in both the generator and the discriminator. This allows the generator to focus more on these regions by considering them in the adversarial counterpart, thus improving the quality of the synthesized images.</p>
				<p>For adversarial learning, the D-RiedGAN discriminator is modified to receive a triplet of images: the input image, the synthetic or real image, and the contrast-enhanced regions of the real or synthetic image. The loss functions of the D-RiedGAN generator and discriminator, defined in (<xref ref-type="disp-formula" rid="e8">8</xref>) and (<xref ref-type="disp-formula" rid="e9">9</xref>), respectively, include the loss from the contrast-enhanced regions (CeR-Loss).</p>
				<p>
					<disp-formula id="e8">
						<graphic xlink:href="2256-5337-teclo-27-60-e207-e8.png"/>
					</disp-formula>
				</p>
				<p>
					<disp-formula id="e9">
						<graphic xlink:href="2256-5337-teclo-27-60-e207-e9.png"/>
					</disp-formula>
				</p>
			</sec>
			<sec>
				<title>3.3 Baseline models</title>
				<p>The Pix2Pix <sup>[</sup><xref ref-type="bibr" rid="B31"><sup>31</sup></xref><sup>],</sup> RiedNet <sup>[</sup><xref ref-type="bibr" rid="B29"><sup>29</sup></xref><sup>],</sup> and Ea-GAN <sup>[</sup><xref ref-type="bibr" rid="B38"><sup>38</sup></xref><sup>]</sup> architectures were employed as benchmarks to evaluate the proposed model. These architectures were chosen due to their proven effectiveness in tackling problems related to medical image synthesis across various modalities.</p>
				<sec>
					<title>3.3.1 Pix2Pix </title>
					<p>The Pix2Pix architecture <sup>[</sup><xref ref-type="bibr" rid="B31"><sup>31</sup></xref><sup>]</sup> uses conditional information to guide the image generation process, allowing it to create an image in one domain based on an input image from another domain. It features a U-Net generator, a PatchGAN discriminator, and an objective function that combines adversarial loss (to make the generated images indistinguishable from the real ones) with pixel-level loss (to ensure content coherence between the generated and real images). A notable advantage of this architecture, as emphasized in the literature, is its capability to preserve fine details in the generated images, which is crucial for post-contrast image generation.</p>
				</sec>
				<sec>
					<title>3.3.2 RiedNet</title>
					<p>RiedNet <sup>[</sup><xref ref-type="bibr" rid="B29"><sup>29</sup></xref><sup>]</sup> is an adapted U-Net architecture that employs convolutional and deconvolutional layers, along with a residual inception block to mitigate gradient fading issues. In this study, the RiedNet architecture was trained to synthesize complete images. Furthermore, the ReLU activation function in the intermediate layers was replaced with the Leaky ReLU function to maintain a small positive slope and avoid complete suppression of information in certain parts of the neural network <sup>[</sup><xref ref-type="bibr" rid="B42"><sup>42</sup></xref><sup>].</sup> The activation function of the output layer was also changed to the hyperbolic tangent function. These adjustments were made to preserve the value range of the input images during encoding.</p>
				</sec>
				<sec>
					<title>3.3.3 Ea-GAN</title>
					<p>Unlike the previous two architectures, Ea-GAN <sup>[</sup><xref ref-type="bibr" rid="B38"><sup>38</sup></xref><sup>]</sup> incorporates edge information from both the original and synthesized images, calculated using a Sobel filter, into the learning process. This edge information helps the architecture focus on synthesizing the textures and edges of objects in the images. The Ea-GAN architecture has two variations: gEa-GAN, which integrates edge differences only in the generator’s loss function, and dEa-GAN, which includes edge differences in both the generator and discriminator.</p>
					<p>To improve the synthesis process, these three foundational architectures were combined. The first combination, called RiedGAN, integrates a PatchGAN discriminator into the RiedNet architecture to enhance the synthesis process using an adversarial learning scheme. The key distinction between this network and the original Pix2Pix is that it employs the U-Net generator from the RiedNet architecture rather than the traditional U-Net generator.</p>
					<p>Building on the idea of using edge maps from the Ea-GAN architecture, edge maps were incorporated into the RiedGAN framework, resulting in two new models: gEa-RiedGAN, which integrates edge maps into the RiedGAN generator, and dEa-RiedGAN, which incorporates edge map information into both the generator and the discriminator.</p>
				</sec>
			</sec>
			<sec>
				<title>3.4 Evaluation metrics</title>
				<p>To assess the quality of the synthetic images, three widely used quantitative metrics were employed: Mean Absolute Error (MAE), Peak Signal-to-Noise Ratio (PSNR), and Structural Similarity Index Measure (SSIM).</p>
				<p>The Mean Absolute Error (MAE) quantifies the pixel-to-pixel difference between the intensities of two images. For a real image, <italic>y</italic>, and a generated image, 𝐺(𝑥), both of size 𝑚 𝑥 𝑛 pixels, MAE is computed as detailed in (<xref ref-type="disp-formula" rid="e10">10</xref>). A low MAE value signifies minimal error between the synthesized image and the reference image, with values close to 0 being ideal, i.e., indicating high accuracy. Conversely, a high MAE value reflects larger error and lower accuracy in image synthesis.</p>
				<p>
					<disp-formula id="e10">
						<graphic xlink:href="2256-5337-teclo-27-60-e207-e10.png"/>
					</disp-formula>
				</p>
				<p>The Peak Signal-to-Noise Ratio (PSNR) represents the ratio between the maximum possible energy of a signal and the noise affecting the signal’s representation, measured in decibels (dB) <sup>[</sup><xref ref-type="bibr" rid="B43"><sup>43</sup></xref><sup>].</sup> The PSNR is defined by the formula in (<xref ref-type="disp-formula" rid="e11">11</xref>), where 𝑀𝐴𝑋<sub>𝑖</sub> denotes the maximum possible intensity value for the images. A high PSNR value indicates greater similarity between the synthesized and reference images, while a low PSNR value suggests greater differences between them.</p>
				<p>
					<disp-formula id="e11">
						<graphic xlink:href="2256-5337-teclo-27-60-e207-e11.png"/>
					</disp-formula>
				</p>
				<p>The Structural Similarity Index Measure (SSIM) considers the strong interdependencies between pixels, especially those in close proximity. These dependencies include information about luminance, contrast, and structure of the objects in the image and can be estimated jointly as shown in Equation (<xref ref-type="disp-formula" rid="e12">12</xref>) <sup>[</sup><xref ref-type="bibr" rid="B43"><sup>43</sup></xref><sup>].</sup> In this equation, 𝜇, 𝜎 and 𝜎<sup>2</sup> represent the means, standard deviations, and covariances between the images, respectively, while ??<sub>1</sub> and 𝑐<sub>2</sub> are variables that stabilize the division in cases where the denominators are close to zero. An SSIM value close to 1 indicates high structural similarity between the synthesized image and the reference image, whereas a low SSIM value reflects reduced structural similarity. Values below 0.4 generally suggest poor quality in terms of image structure and texture.</p>
				<p>
					<disp-formula id="e12">
						<graphic xlink:href="2256-5337-teclo-27-60-e207-e12.png"/>
					</disp-formula>
				</p>
				<p>Finally, difference maps are calculated by comparing individual pixels between a generated image and a real image to evaluate their discrepancies. This process is described by (<xref ref-type="disp-formula" rid="e13">13</xref>), where each pixel in the images is analyzed, and the difference in intensity between corresponding pixels in the two images is estimated. Each pixel’s value represents its intensity, and pixel comparison involves subtracting the value of the corresponding pixel in one image from the value of the same pixel in the other image. This comparison is used to quantify and visualize the differences between the generated and real images.</p>
				<p>
					<disp-formula id="e13">
						<graphic xlink:href="2256-5337-teclo-27-60-e207-e13.png"/>
					</disp-formula>
				</p>
			</sec>
		</sec>
		<sec sec-type="results|discussion">
			<title>4. RESULTS AND DISCUSSION</title>
			<sec>
				<title>4.1 Experimental setup</title>
				<p>The results presented in this study were obtained using the experimental setup detailed in <xref ref-type="table" rid="t1">Table 1</xref>. This table outlines the hyperparameters employed for each model, which were adjusted according to the available computational resources. The experiments were conducted on a workstation equipped with an Intel Xeon Silver 4108 CPU and an NVIDIA Quadro P2000 GPU with 4 GB of RAM. Python version 3.8 was used as the programming language, along with PyTorch version 2.0.</p>
				<p>
					<table-wrap id="t1">
						<label>Table 1</label>
						<caption>
							<title>Hyperparameters employed in the experiments</title>
						</caption>
						<graphic xlink:href="2256-5337-teclo-27-60-e207-gt1.png"/>
						<table-wrap-foot>
							<fn id="TFN1">
								<p>Source: Own work.</p>
							</fn>
						</table-wrap-foot>
					</table-wrap>
				</p>
			</sec>
			<sec>
				<title>4.2 Database</title>
				<p>A proprietary, retrospective, and anonymized database of DCE-MRI studies from 197 patients was used to train the models. Each study includes T1- and T2-weighted structural images, Diffusion Weighted images (DWIs), and six DCE images. This study focused on the T1 fat-saturated sequence acquired before contrast agent administration <italic>x</italic> and the corresponding image acquired in the early stage after contrast agent administration <italic>y</italic>.</p>
				<p> Given the retrospective nature of the database, studies were selected based on their use of different types of 1.5 T resonators and gadolinium-based contrast agents, with doses ranging between 0.014 and 0.016 ml/mol. All studies contained at least one abnormality (either benign or malignant) annotated by expert radiologists using the BI-RADS system. This selection process ensured a balanced representation of both benign and malignant cases.</p>
				<p>To focus on synthesizing contrast regions, only images with annotated contrast regions were included to ensure accurate depiction of contrast uptake. As a result, a total of 937 normalized images, scaled to the range from -1 to 1, were processed. Of these, 718 images were allocated for training and 219 for validation. The original images, with resolutions ranging between 480x480 and 512x512 pixels, were resized to 240x240 pixels for consistency purposes.</p>
			</sec>
			<sec>
				<title>4.3 Comparative evaluation</title>
				<p>
					<xref ref-type="fig" rid="f2">Figure 2</xref> presents a comparison of the PSNR, SSIM, and MAE metrics for the models assessed on the validation image set. As observed, the G-RiedGAN and D-RiedGAN models proposed in this study outperformed the other models. This suggests that incorporating contrast-enhanced regions into the image synthesis process using the CeR-Loss function significantly enhances the quality of the synthetic images, as reflected by the values of these quantitative metrics.</p>
				<p>
					<fig id="f2">
						<label>Figure 2</label>
						<caption>
							<title>Scatter plot comparing PSNR, SSIM, and MAE across the baseline, mixed, and proposed models</title>
						</caption>
						<graphic xlink:href="2256-5337-teclo-27-60-e207-gf2.jpg"/>
						<attrib>Source: Own work.</attrib>
					</fig>
				</p>
				<p>Although G-RiedGAN and D-RiedGAN showed a slightly higher MAE compared to RiedGAN, the increase in MAE for D-RiedGAN was minimal and is outweighed by substantial improvements in PSNR and SSIM. This indicates that while RiedGAN demonstrated slightly better accuracy in individual pixel errors, it tends to produce more blurred images of internal structures, making it less suitable for medical image synthesis.</p>
				<p>In comparison to Pix2Pix <sup>[</sup><xref ref-type="bibr" rid="B31"><sup>31</sup></xref><sup>]</sup>-a model frequently used in similar studies-both G-RiedGAN and D-RiedGAN exhibited superior performance in terms of PSNR and SSIM. They excelled particularly in synthesizing contrast-enhanced regions and reducing noise, thus addressing some of the limitations of Pix2Pix in dense breast imaging.</p>
				<p>
					<xref ref-type="fig" rid="f3">Figure 3</xref>, for its part, displays real post-contrast images generated from their non-contrast counterparts. Overall, the models effectively reproduced larger anatomical structures, though some discrepancies were observed in the intensities of rib cage structures. Despite this, G-RiedGAN and D-RiedGAN showed superior synthesis of contrast-enhanced regions compared to reference models such as RiedNet <sup>[</sup><xref ref-type="bibr" rid="B29"><sup>29</sup></xref><sup>],</sup> Pix2Pix <sup>[</sup><xref ref-type="bibr" rid="B31"><sup>31</sup></xref><sup>],</sup> and EaGAN <sup>[</sup><xref ref-type="bibr" rid="B32"><sup>32</sup></xref><sup>].</sup> These reference models, which served as the foundation for G-RiedGAN and D-RiedGAN, were employed for comparative analysis with the same methodology. While effective in their respective contexts, this study specifically evaluated their performance with medical images.</p>
				<p>
					<fig id="f3">
						<label>Figure 3</label>
						<caption>
							<title>Results of the comparative analysis between the evaluated models. The zoomed regions highlight projections where the contrast agent was captured</title>
						</caption>
						<graphic xlink:href="2256-5337-teclo-27-60-e207-gf3.jpg"/>
						<attrib>Source: Own work.</attrib>
					</fig>
				</p>
				<p>Based on the results, G-RiedGAN and D-RiedGAN combine the strengths of existing models to achieve more precise and higher-quality image synthesis, particularly in contrast-enhanced regions. They also performed well when compared to models reported in the literature, notably in minimizing noise and blur. This is further illustrated in <xref ref-type="fig" rid="f4">Figure 4</xref>, which shows the difference maps of the synthetic and real images. As can be seen, the difference maps for G-RiedGAN and D-RiedGAN reveal fewer discrepancies between the synthetic and real images.</p>
				<p>
					<fig id="f4">
						<label>Figure 4</label>
						<caption>
							<title>Difference maps between the real images and those generated by the evaluated models.</title>
						</caption>
						<graphic xlink:href="2256-5337-teclo-27-60-e207-gf4.jpg"/>
						<attrib>Source: Own work.</attrib>
					</fig>
				</p>
			</sec>
			<sec>
				<title>4.4 Impact of the contrast-enhanced regions’ cost function (CeR-Loss)</title>
				<p>The proposed cost function, CeR-Loss, is a critical component of the D-RiedGAN architecture, significantly enhancing its performance when compared to other models. To evaluate the impact of this function on model training, a series of experiments were conducted using the D-RiedGAN architecture (described in the previous section) but with variations in parameters 𝜆<sub>𝑙1</sub> and <italic>𝜆</italic>
 <sub>
 <italic>𝐿𝑜𝑣𝑎𝑠𝑧</italic>
</sub> . In these experiments, 𝜆<sub>
 <italic>𝐿𝑜𝑣𝑎𝑠𝑧</italic> 
</sub> was consistently set higher than <italic>𝜆</italic>
 <sub>
 <italic>𝑙1</italic> 
</sub> across all configurations.</p>
				<p>
					<xref ref-type="fig" rid="f5">Figure 5</xref> illustrates the results for three different parameter settings: <italic>𝜆</italic>
 <sub>
 <italic>𝑙1</italic>
</sub> = 20 and 𝜆<sub>
 <italic>𝐿𝑜𝑣𝑎𝑠𝑧</italic>
</sub> = 30; 𝜆<sub>𝑙1</sub> = 40 and 𝜆<sub>
 <italic>𝐿𝑜𝑣𝑎𝑠𝑧</italic>
</sub> = 60; and 𝜆<sub>𝑙1</sub> = 100 and <italic>𝜆</italic>
 <sub>
 <italic>??𝑜𝑣𝑎𝑠𝑧</italic>
</sub> = 150. As observed, both the MAE and PSNR metrics improved as the values of 𝜆<sub>𝑙1</sub> and <italic>𝜆</italic>
 <sub>
 <italic>𝐿𝑜𝑣𝑎𝑠𝑧</italic>
</sub> was increased, with the best performance achieved at <italic>𝜆</italic>
 <sub>
 <italic>𝑙1</italic>
</sub> = 100 and <italic>𝜆</italic>
 <sub>
 <italic>𝐿𝑜𝑣𝑎𝑠𝑧</italic>
</sub> = 150. These results underscore the positive effect of the CeR-Loss cost function on the model’s overall performance.</p>
				<p>
					<fig id="f5">
						<label>Figure 5</label>
						<caption>
							<title>Evaluation of the impact of the CeR-Loss function on the performance of the D-RiedGAN architecture</title>
						</caption>
						<graphic xlink:href="2256-5337-teclo-27-60-e207-gf5.png"/>
						<attrib>Source: own work.</attrib>
					</fig>
				</p>
			</sec>
		</sec>
		<sec sec-type="conclusions">
			<title>5. CONCLUSIONS</title>
			<p>This paper introduced CeR-Loss, a novel cost function designed to leverage contrast agent uptake for generating synthetic post-contrast images from pre-contrast images in DCE-MRI studies. This function is incorporated into two new deep learning architectures, G-RiedGAN and D-RiedGAN, which focus on contrast-enhanced regions to improve the synthesis of post-contrast images. The primary goal of these architectures is to minimize dependence on contrast agents and reduce the costs associated with DCE-MRI studies for breast cancer screening.</p>
			<p>The proposed G-RiedGAN and D-RiedGAN models combine features from the RIED-Net and Pix2Pix architectures within the EaGAN framework. Notably, D-RiedGAN includes a filter for detecting contrast-enhanced regions, which are essential for accurately synthesizing DCE-MRI images in breast cancer detection and diagnosis. These identified contrast regions guide the network learning process through the Lovász and BCE loss functions, which are integrated into the loss function of the generator and the discriminator (CeR-Loss).</p>
			<p>Two approaches were used for comparative evaluation. The first approach compared the performance of the proposed models (with CeR-Loss) against models documented in the literature and a set of mixed models. The results, based on MAE, PSNR, and SSIM metrics, indicate that the proposed models more effectively synthesize contrast-enhanced regions, with reduced noise and blur. The second approach assessed the impact of the CeR-Loss function on the learning process, revealing that increasing the weight of CeR-Loss positively influences the synthesis of contrast regions, as reflected by the value of the same metrics.</p>
			<p>Although validation was limited to quantitative metrics based on pixel intensities of synthetic images, future studies should include qualitative assessments by expert radiologists to validate the diagnostic quality of these images. Additionally, future research should investigate the performance of the baseline and proposed models across heterogeneous image databases, considering variations in study quality (0.5 T, 1.5 T, 3 T, and 7 T), dosage, and contrast agents. Furthermore, incorporating synthetic post-contrast images could improve the training of breast cancer detection and classification models that use conventional MRI images, as these synthetic images might provide valuable supplementary information to enhance model performance.</p>
		</sec>
	</body>
	<back>
		<ack>
			<title>6. ACKNOWLEDGEMENTS AND FUNDING</title>
			<p>This study was partially funded by the Instituto Tecnológico Metropolitano (ITM) in Medellín, Colombia, through research project P20213, as well as by the Institución Universitaria Pascual Bravo and Ayudas Diagnósticas SURA S.A.S. under agreement CE-007-2020. Additional funding was provided by SAPIENCIA, the education agency of Medellín.</p>
		</ack>
		<ref-list>
			<title>REFERENCES</title>
			<ref id="B1">
				<label>[1]</label>
				<mixed-citation>[1] M. P. Jimenez Herrera, “Informe de Evento Cáncer de Mama y Cuello Uterino en Colombia 2018,” Instituto Nacional de Salud, Colombia, Versión 04, May 2018. [Online]. Available: <ext-link ext-link-type="uri" xlink:href="https://bit.ly/3J1FcnV">https://bit.ly/3J1FcnV</ext-link>
				</mixed-citation>
				<element-citation publication-type="report">
					<person-group person-group-type="author">
						<name>
							<surname>Jimenez Herrera</surname>
							<given-names>M. P.</given-names>
						</name>
					</person-group>
					<source>Informe de Evento Cáncer de Mama y Cuello Uterino en Colombia 2018</source>
					<publisher-name>Instituto Nacional de Salud</publisher-name>
					<publisher-loc>Colombia</publisher-loc>
					<comment>Versión 04</comment>
					<month>05</month>
					<year>2018</year>
					<comment>Online</comment>
					<comment>Available</comment>
					<ext-link ext-link-type="uri" xlink:href="https://bit.ly/3J1FcnV">https://bit.ly/3J1FcnV</ext-link>
				</element-citation>
			</ref>
			<ref id="B2">
				<label>[2]</label>
				<mixed-citation>[2] M. Martín, A. Herrero, and I. Echavarría, “El cáncer de mama,” <italic>Arbor</italic>, vol. 191, no. 773, p. a234, Jun. 2015. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3989/arbor.2015.773n3004">https://doi.org/10.3989/arbor.2015.773n3004</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Martín</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>Herrero</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Echavarría</surname>
							<given-names>I.</given-names>
						</name>
					</person-group>
					<article-title>El cáncer de mama</article-title>
					<source>Arbor</source>
					<volume>191</volume>
					<issue>773</issue>
					<fpage>a234</fpage>
					<lpage>a234</lpage>
					<month>06</month>
					<year>2015</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3989/arbor.2015.773n3004">https://doi.org/10.3989/arbor.2015.773n3004</ext-link>
				</element-citation>
			</ref>
			<ref id="B3">
				<label>[3]</label>
				<mixed-citation>[3] IARC. “Data visualization tools for exploring the global cancer burden in 2022.” iarc.who. Accessed: Feb. 20, 2024. [Online.] Available: <ext-link ext-link-type="uri" xlink:href="https://gco.iarc.who.int/today/en">https://gco.iarc.who.int/today/en</ext-link>
				</mixed-citation>
				<element-citation publication-type="webpage">
					<person-group person-group-type="author">
						<collab>IARC</collab>
					</person-group>
					<source>Data visualization tools for exploring the global cancer burden in 2022</source>
					<publisher-name>iarc.who</publisher-name>
					<comment>Accessed</comment>
					<day>20</day>
					<month>02</month>
					<year>2024</year>
					<comment>Online</comment>
					<comment>Available</comment>
					<ext-link ext-link-type="uri" xlink:href="https://gco.iarc.who.int/today/en">https://gco.iarc.who.int/today/en</ext-link>
				</element-citation>
			</ref>
			<ref id="B4">
				<label>[4]</label>
				<mixed-citation>[4] X. Zhou <italic>et al</italic>., “A Comprehensive Review for Breast Histopathology Image Analysis Using Classical and Deep Neural Networks,” <italic>IEEE Access</italic>, vol. 8, pp. 90931-90956, May. 2020. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/ACCESS.2020.2993788">https://doi.org/10.1109/ACCESS.2020.2993788</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Zhou</surname>
							<given-names>X.</given-names>
						</name>
						<etal/>
					</person-group>
					<article-title>A Comprehensive Review for Breast Histopathology Image Analysis Using Classical and Deep Neural Networks</article-title>
					<source>IEEE Access</source>
					<volume>8</volume>
					<fpage>90931</fpage>
					<lpage>90956</lpage>
					<month>05</month>
					<year>2020</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/ACCESS.2020.2993788">https://doi.org/10.1109/ACCESS.2020.2993788</ext-link>
				</element-citation>
			</ref>
			<ref id="B5">
				<label>[5]</label>
				<mixed-citation>[5] H. V. Guleria <italic>et al.</italic>, “Enhancing the breast histopathology image analysis for cancer detection using Variational Autoencoder,” <italic>Int. J. Environ. Res. Public Health.</italic>, vol. 20, no. 5, p. 4244, Feb. 2023. <ext-link ext-link-type="uri" xlink:href="https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10002012/">https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10002012/</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Guleria</surname>
							<given-names>H. V.</given-names>
						</name>
						<etal/>
					</person-group>
					<article-title>Enhancing the breast histopathology image analysis for cancer detection using Variational Autoencoder</article-title>
					<source>Int. J. Environ. Res. Public Health.</source>
					<volume>20</volume>
					<issue>5</issue>
					<fpage>4244</fpage>
					<lpage>4244</lpage>
					<month>02</month>
					<year>2023</year>
					<ext-link ext-link-type="uri" xlink:href="https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10002012/">https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10002012/</ext-link>
				</element-citation>
			</ref>
			<ref id="B6">
				<label>[6]</label>
				<mixed-citation>[6] Instituto Nacional del Cáncer. “Tratamiento del cáncer de seno.” cancer.gov. Accessed: Feb. 20, 2024. [Online.] Available: <ext-link ext-link-type="uri" xlink:href="https://www.cancer.gov/espanol/tipos/seno/paciente/tratamiento-seno-pdq">https://www.cancer.gov/espanol/tipos/seno/paciente/tratamiento-seno-pdq</ext-link>
				</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<collab>Instituto Nacional del Cáncer</collab>
					</person-group>
					<source>Tratamiento del cáncer de seno</source>
					<publisher-name>cancer.gov.</publisher-name>
					<comment>Accessed</comment>
					<day>20</day>
					<month>02</month>
					<year>2024</year>
					<comment>Online</comment>
					<comment>Available</comment>
					<ext-link ext-link-type="uri" xlink:href="https://www.cancer.gov/espanol/tipos/seno/paciente/tratamiento-seno-pdq">https://www.cancer.gov/espanol/tipos/seno/paciente/tratamiento-seno-pdq</ext-link>
				</element-citation>
			</ref>
			<ref id="B7">
				<label>[7]</label>
				<mixed-citation>[7] S. G. Macias, “Métodos de imagen en el estudio de la mama - Ecografía mamaria,” Editorial Medica Panamericana, Bogotá, Colombia, Módulo 1, 2019. <ext-link ext-link-type="uri" xlink:href="https://bit.ly/4aFIg4y">https://bit.ly/4aFIg4y</ext-link>
				</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Macias</surname>
							<given-names>S. G.</given-names>
						</name>
					</person-group>
					<source>Métodos de imagen en el estudio de la mama - Ecografía mamaria</source>
					<publisher-name>Editorial Medica Panamericana</publisher-name>
					<publisher-loc>Bogotá, Colombia</publisher-loc>
					<comment>Módulo 1</comment>
					<year>2019</year>
					<ext-link ext-link-type="uri" xlink:href="https://bit.ly/4aFIg4y">https://bit.ly/4aFIg4y</ext-link>
				</element-citation>
			</ref>
			<ref id="B8">
				<label>[8]</label>
				<mixed-citation>[8] P. E. Freer, “Mammographic breast density: Impact on breast cancer risk and implications for screening,” <italic>Radiographics</italic>, vol. 35, no. 2, pp. 302-315, Mar. 2015. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1148/rg.352140106">https://doi.org/10.1148/rg.352140106</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Freer</surname>
							<given-names>P. E.</given-names>
						</name>
					</person-group>
					<article-title>Mammographic breast density: Impact on breast cancer risk and implications for screening</article-title>
					<source>Radiographics</source>
					<volume>35</volume>
					<issue>2</issue>
					<fpage>302</fpage>
					<lpage>315</lpage>
					<month>03</month>
					<year>2015</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1148/rg.352140106">https://doi.org/10.1148/rg.352140106</ext-link>
				</element-citation>
			</ref>
			<ref id="B9">
				<label>[9]</label>
				<mixed-citation>[9] P. Campáz-Usuga, R. D. Fonnegra, and C. Mera, “Quality Enhancement of Breast DCE-MRI Images Via Convolutional Autoencoders,” in <italic>2021 IEEE 2nd International Congress of Biomedical Engineering and Bioengineering (CI-IB&amp;BI)</italic>, Bogotá D.C., Colombia, 2021, pp. 1-4. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/CI-IBBI54220.2021.9626097">https://doi.org/10.1109/CI-IBBI54220.2021.9626097</ext-link>
				</mixed-citation>
				<element-citation publication-type="confproc">
					<person-group person-group-type="author">
						<name>
							<surname>Campáz-Usuga</surname>
							<given-names>P.</given-names>
						</name>
						<name>
							<surname>Fonnegra</surname>
							<given-names>R. D.</given-names>
						</name>
						<name>
							<surname>Mera</surname>
							<given-names>C.</given-names>
						</name>
					</person-group>
					<source>Quality Enhancement of Breast DCE-MRI Images Via Convolutional Autoencoders</source>
					<conf-name>2021 IEEE 2nd International Congress of Biomedical Engineering and Bioengineering (CI-IB&amp;BI)</conf-name>
					<conf-loc>Bogotá D.C., Colombia</conf-loc>
					<conf-date>2021</conf-date>
					<fpage>1</fpage>
					<lpage>4</lpage>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/CI-IBBI54220.2021.9626097">https://doi.org/10.1109/CI-IBBI54220.2021.9626097</ext-link>
				</element-citation>
			</ref>
			<ref id="B10">
				<label>[10]</label>
				<mixed-citation>[10] Y. M. Rodríguez Marcano, I. González, H. Palencia, M. Sandoval, and L. León, “Mamografía espectral con realce de contraste. Nuestra experiencia,” <italic>Revista Venezolana de Oncologia</italic>, vol. 26, no. 4, pp. 743-751, Dec. 2014. <ext-link ext-link-type="uri" xlink:href="https://www.redalyc.org/articulo.oa?id=375633971003">https://www.redalyc.org/articulo.oa?id=375633971003</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Rodríguez Marcano</surname>
							<given-names>Y. M.</given-names>
						</name>
						<name>
							<surname>González</surname>
							<given-names>I.</given-names>
						</name>
						<name>
							<surname>Palencia</surname>
							<given-names>H.</given-names>
						</name>
						<name>
							<surname>Sandoval</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>León</surname>
							<given-names>L.</given-names>
						</name>
					</person-group>
					<article-title>Mamografía espectral con realce de contraste. Nuestra experiencia</article-title>
					<source>Revista Venezolana de Oncologia</source>
					<volume>26</volume>
					<issue>4</issue>
					<fpage>743</fpage>
					<lpage>751</lpage>
					<month>12</month>
					<year>2014</year>
					<ext-link ext-link-type="uri" xlink:href="https://www.redalyc.org/articulo.oa?id=375633971003">https://www.redalyc.org/articulo.oa?id=375633971003</ext-link>
				</element-citation>
			</ref>
			<ref id="B11">
				<label>[11]</label>
				<mixed-citation>[11] I. Pérez-Zúñiga, Y. Villaseñor-Navarro, M. P. Pérez-Badillo, R. Cruz-Morales, C. Pavón-Hernández, and L. Aguilar-Cortázar, “Resonancia magnética de mama y sus aplicaciones,” <italic>Gaceta Mexicana de Oncologia</italic>, vol. 11, no. 4, pp. 268-280, 2012. <ext-link ext-link-type="uri" xlink:href="https://www.elsevier.es/es-revista-gaceta-mexicana oncologia-305-articulo-resonancia-magnetica-mama-sus-aplicaciones-X1665920112544919">https://www.elsevier.es/es-revista-gaceta-mexicana oncologia-305-articulo-resonancia-magnetica-mama-sus-aplicaciones-X1665920112544919</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Pérez-Zúñiga</surname>
							<given-names>I.</given-names>
						</name>
						<name>
							<surname>Villaseñor-Navarro</surname>
							<given-names>Y.</given-names>
						</name>
						<name>
							<surname>Pérez-Badillo</surname>
							<given-names>M. P.</given-names>
						</name>
						<name>
							<surname>Cruz-Morales</surname>
							<given-names>R.</given-names>
						</name>
						<name>
							<surname>Pavón-Hernández</surname>
							<given-names>C.</given-names>
						</name>
						<name>
							<surname>Aguilar-Cortázar</surname>
							<given-names>L.</given-names>
						</name>
					</person-group>
					<article-title>Resonancia magnética de mama y sus aplicaciones</article-title>
					<source>Gaceta Mexicana de Oncologia</source>
					<volume>11</volume>
					<issue>4</issue>
					<fpage>268</fpage>
					<lpage>280</lpage>
					<year>2012</year>
					<ext-link ext-link-type="uri" xlink:href="https://www.elsevier.es/es-revista-gaceta-mexicana oncologia-305-articulo-resonancia-magnetica-mama-sus-aplicaciones-X1665920112544919">https://www.elsevier.es/es-revista-gaceta-mexicana oncologia-305-articulo-resonancia-magnetica-mama-sus-aplicaciones-X1665920112544919</ext-link>
				</element-citation>
			</ref>
			<ref id="B12">
				<label>[12]</label>
				<mixed-citation>[12] C. Balleyguier <italic>et al.</italic>, “New potential and applications of contrast-enhanced ultrasound of the breast: Own investigations and review of the literature,” <italic>Eur. J. Radiol.</italic>, vol. 69, no. 1, pp. 14-23, Jan. 2009. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1016/J.EJRAD.2008.07.037">https://doi.org/10.1016/J.EJRAD.2008.07.037</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Balleyguier</surname>
							<given-names>C.</given-names>
						</name>
						<etal/>
					</person-group>
					<article-title>New potential and applications of contrast-enhanced ultrasound of the breast: Own investigations and review of the literature</article-title>
					<source>Eur. J. Radiol.</source>
					<volume>69</volume>
					<issue>1</issue>
					<fpage>14</fpage>
					<lpage>23</lpage>
					<month>01</month>
					<year>2009</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1016/J.EJRAD.2008.07.037">https://doi.org/10.1016/J.EJRAD.2008.07.037</ext-link>
				</element-citation>
			</ref>
			<ref id="B13">
				<label>[13]</label>
				<mixed-citation>[13] R. Valenzuela, O. Arevalo, A. Tavera, R. Riascos, E. Bonfante, and R. Patel, “Imágenes del depósito de gadolinio en el sistema nervioso central,” <italic>Revista Chilena de Radiologia</italic>, vol. 23, no. 2, pp. 59-65, Jul. 2017. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.4067/S0717-93082017000200005">https://doi.org/10.4067/S0717-93082017000200005</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Valenzuela</surname>
							<given-names>R.</given-names>
						</name>
						<name>
							<surname>Arevalo</surname>
							<given-names>O.</given-names>
						</name>
						<name>
							<surname>Tavera</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Riascos</surname>
							<given-names>R.</given-names>
						</name>
						<name>
							<surname>Bonfante</surname>
							<given-names>E.</given-names>
						</name>
						<name>
							<surname>Patel</surname>
							<given-names>R.</given-names>
						</name>
					</person-group>
					<article-title>Imágenes del depósito de gadolinio en el sistema nervioso central</article-title>
					<source>Revista Chilena de Radiologia</source>
					<volume>23</volume>
					<issue>2</issue>
					<fpage>59</fpage>
					<lpage>65</lpage>
					<month>07</month>
					<year>Jul. 2017</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.4067/S0717-93082017000200005">https://doi.org/10.4067/S0717-93082017000200005</ext-link>
				</element-citation>
			</ref>
			<ref id="B14">
				<label>[14]</label>
				<mixed-citation>[14] F. Gao, T. Wu, X. Chu, H. Yoon, Y. Xu, and B. Patel, “Deep Residual Inception Encoder-Decoder Network for Medical Imaging Synthesis,” <italic>IEEE J. Biomed. Health Inform.</italic>, vol. 24, no. 1, pp. 39-49, Jan. 2020. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/JBHI.2019.2912659">https://doi.org/10.1109/JBHI.2019.2912659</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Gao</surname>
							<given-names>F.</given-names>
						</name>
						<name>
							<surname>Wu</surname>
							<given-names>T.</given-names>
						</name>
						<name>
							<surname>Chu</surname>
							<given-names>X.</given-names>
						</name>
						<name>
							<surname>Yoon</surname>
							<given-names>H.</given-names>
						</name>
						<name>
							<surname>Xu</surname>
							<given-names>Y.</given-names>
						</name>
						<name>
							<surname>Patel</surname>
							<given-names>.</given-names>
						</name>
					</person-group>
					<article-title>Deep Residual Inception Encoder-Decoder Network for Medical Imaging Synthesis</article-title>
					<source>IEEE J. Biomed. Health Inform.</source>
					<volume>24</volume>
					<issue>1</issue>
					<fpage>39</fpage>
					<lpage>49</lpage>
					<month>06</month>
					<year>2020</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/JBHI.2019.2912659">https://doi.org/10.1109/JBHI.2019.2912659</ext-link>
				</element-citation>
			</ref>
			<ref id="B15">
				<label>[15]</label>
				<mixed-citation>[15] F. Gao <italic>et al.</italic>, “SD-CNN: A shallow-deep CNN for improved breast cancer diagnosis,” <italic>Computerized Medical Imaging and Graphics</italic>, vol. 70, pp. 53-62, Dec. 2018. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1016/j.compmedimag.2018.09.004">https://doi.org/10.1016/j.compmedimag.2018.09.004</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Gao</surname>
							<given-names>F.</given-names>
						</name>
						<etal/>
					</person-group>
					<article-title>SD-CNN: A shallow-deep CNN for improved breast cancer diagnosis</article-title>
					<source>Computerized Medical Imaging and Graphics</source>
					<volume>70</volume>
					<fpage>53</fpage>
					<lpage>62</lpage>
					<month>12</month>
					<year>2018</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1016/j.compmedimag.2018.09.004">https://doi.org/10.1016/j.compmedimag.2018.09.004</ext-link>
				</element-citation>
			</ref>
			<ref id="B16">
				<label>[16]</label>
				<mixed-citation>[16] K. Wu <italic>et al.</italic>, “Image synthesis in contrast MRI based on super resolution reconstruction with multi-refinement cycle-consistent generative adversarial networks,” <italic>J. Intell. Manuf.</italic>, vol. 31, no. 5, pp. 1215-1228, Jun. 2020. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/s10845-019-01507-7">https://doi.org/10.1007/s10845-019-01507-7</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Wu</surname>
							<given-names>K.</given-names>
						</name>
						<etal/>
					</person-group>
					<article-title>Image synthesis in contrast MRI based on super resolution reconstruction with multi-refinement cycle-consistent generative adversarial networks</article-title>
					<source>J. Intell. Manuf.</source>
					<volume>31</volume>
					<issue>5</issue>
					<fpage>1215</fpage>
					<lpage>1228</lpage>
					<month>06</month>
					<year>2020</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/s10845-019-01507-7">https://doi.org/10.1007/s10845-019-01507-7</ext-link>
				</element-citation>
			</ref>
			<ref id="B17">
				<label>[17]</label>
				<mixed-citation>[17] E. Kim, C. Hwan-Ho, J. Kwon, O. Young-Tack, E. S. Ko, and H. Park, “Tumor-Attentive Segmentation-Guided GAN for Synthesizing Breast Contrast-Enhanced MRI Without Contrast Agents,” <italic>IEEE Journal of Translational Engineering in Health and Medicine</italic>, vol. 11, pp. 32-43, Nov. 2023. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/JTEHM.2022.3221918">https://doi.org/10.1109/JTEHM.2022.3221918</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Kim</surname>
							<given-names>E.</given-names>
						</name>
						<name>
							<surname>Hwan-Ho</surname>
							<given-names>C.</given-names>
						</name>
						<name>
							<surname>Kwon</surname>
							<given-names>J.</given-names>
						</name>
						<name>
							<surname>Young-Tack</surname>
							<given-names>O.</given-names>
						</name>
						<name>
							<surname>Ko</surname>
							<given-names>E. S.</given-names>
						</name>
						<name>
							<surname>Park</surname>
							<given-names>H.</given-names>
						</name>
					</person-group>
					<article-title>Tumor-Attentive Segmentation-Guided GAN for Synthesizing Breast Contrast-Enhanced MRI Without Contrast Agents</article-title>
					<source>IEEE Journal of Translational Engineering in Health and Medicine</source>
					<volume>11</volume>
					<fpage>32</fpage>
					<lpage>43</lpage>
					<month>11</month>
					<year>2023</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/JTEHM.2022.3221918">https://doi.org/10.1109/JTEHM.2022.3221918</ext-link>
				</element-citation>
			</ref>
			<ref id="B18">
				<label>[18]</label>
				<mixed-citation>[18] Y. Jiang, Y. Zheng, W. Jia, S. Song, and Y. Ding, “Synthesis of contrast-enhanced spectral mammograms from low-energy mammograms using cGAN-based synthesis network,” in <italic>Medical Image Computing and Computer Assisted Intervention - MICCAI 2021</italic>, M. de Bruijne, <italic>et al.</italic>, Eds. Cham: Springer International Publishing, 2021, pp. 68-77. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/978-3-030-87234-2_7">https://doi.org/10.1007/978-3-030-87234-2_7</ext-link>
				</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Jiang</surname>
							<given-names>Y.</given-names>
						</name>
						<name>
							<surname>Zheng</surname>
							<given-names>Y.</given-names>
						</name>
						<name>
							<surname>Jia</surname>
							<given-names>W.</given-names>
						</name>
						<name>
							<surname>Song</surname>
							<given-names>S.</given-names>
						</name>
						<name>
							<surname>Ding</surname>
							<given-names>Y.</given-names>
						</name>
					</person-group>
					<chapter-title>Synthesis of contrast-enhanced spectral mammograms from low-energy mammograms using cGAN-based synthesis network</chapter-title>
					<source>Medical Image Computing and Computer Assisted Intervention - MICCAI 2021</source>
					<person-group person-group-type="editor">
						<name>
							<surname>de Bruijne</surname>
							<given-names>M.</given-names>
						</name>
						<etal/>
					</person-group>
					<comment>Eds.</comment>
					<publisher-loc>Cham</publisher-loc>
					<publisher-name>Springer International Publishing</publisher-name>
					<year>2021</year>
					<fpage>68</fpage>
					<lpage>77</lpage>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/978-3-030-87234-2_7">https://doi.org/10.1007/978-3-030-87234-2_7</ext-link>
				</element-citation>
			</ref>
			<ref id="B19">
				<label>[19]</label>
				<mixed-citation>[19] D. Huangz, and M. Feng, “Understanding Deep Convolutional Networks for Biomedical Imaging: A Practical Tutorial,” in <italic>2019 41st Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC)</italic>, Berlin, Germany, 2019, , pp. 857-863. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/EMBC.2019.8857529">https://doi.org/10.1109/EMBC.2019.8857529</ext-link>
				</mixed-citation>
				<element-citation publication-type="confproc">
					<person-group person-group-type="author">
						<name>
							<surname>Huangz</surname>
							<given-names>D.</given-names>
						</name>
						<name>
							<surname>Feng</surname>
							<given-names>M.</given-names>
						</name>
					</person-group>
					<source>Understanding Deep Convolutional Networks for Biomedical Imaging: A Practical Tutorial</source>
					<conf-name>2019 41st Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC)</conf-name>
					<conf-loc>Berlin, Germany</conf-loc>
					<conf-date>2019</conf-date>
					<fpage>857</fpage>
					<lpage>863</lpage>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/EMBC.2019.8857529">https://doi.org/10.1109/EMBC.2019.8857529</ext-link>
				</element-citation>
			</ref>
			<ref id="B20">
				<label>[20]</label>
				<mixed-citation>[20] C. Shorten, and T. M. Khoshgoftaar, “A survey on Image Data Augmentation for Deep Learning,” <italic>J. Big Data</italic>, vol. 6, no. 1, Jul. 2019. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1186/s40537-019-0197-0">https://doi.org/10.1186/s40537-019-0197-0</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Shorten</surname>
							<given-names>C.</given-names>
						</name>
						<name>
							<surname>Khoshgoftaar</surname>
							<given-names>T. M.</given-names>
						</name>
					</person-group>
					<article-title>A survey on Image Data Augmentation for Deep Learning</article-title>
					<source>J. Big Data</source>
					<volume>6</volume>
					<issue>1</issue>
					<month>07</month>
					<year>2019</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1186/s40537-019-0197-0">https://doi.org/10.1186/s40537-019-0197-0</ext-link>
				</element-citation>
			</ref>
			<ref id="B21">
				<label>[21]</label>
				<mixed-citation>[21] A. Beers <italic>et al.</italic>, “High-resolution medical image synthesis using progressively grown generative adversarial networks,” 2018, <italic>ArXiv: 1805.03144</italic>. <ext-link ext-link-type="uri" xlink:href="https://arxiv.org/abs/1805.03144">https://arxiv.org/abs/1805.03144</ext-link>
				</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Beers</surname>
							<given-names>A.</given-names>
						</name>
						<etal/>
					</person-group>
					<source>High-resolution medical image synthesis using progressively grown generative adversarial networks</source>
					<year>2018</year>
					<publisher-name>ArXiv: 1805.03144</publisher-name>
					<ext-link ext-link-type="uri" xlink:href="https://arxiv.org/abs/1805.03144">https://arxiv.org/abs/1805.03144</ext-link>
				</element-citation>
			</ref>
			<ref id="B22">
				<label>[22]</label>
				<mixed-citation>[22] T. Shen, C. Gou, J. Wang, and F. -Y. Wang, “Collaborative Adversarial Networks for Joint Synthesis and Segmentation of X-ray Breast Mass Images,” in <italic>2020 Chinese Automation Congress (CAC)</italic>, Shanghai, China, 2020, pp. 1743-1747. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/CAC51589.2020.9326848">https://doi.org/10.1109/CAC51589.2020.9326848</ext-link>
				</mixed-citation>
				<element-citation publication-type="confproc">
					<person-group person-group-type="author">
						<name>
							<surname>Shen</surname>
							<given-names>T.</given-names>
						</name>
						<name>
							<surname>Gou</surname>
							<given-names>C.</given-names>
						</name>
						<name>
							<surname>Wang</surname>
							<given-names>J.</given-names>
						</name>
						<name>
							<surname>Wang</surname>
							<given-names>F. -Y.</given-names>
						</name>
					</person-group>
					<source>Collaborative Adversarial Networks for Joint Synthesis and Segmentation of X-ray Breast Mass Images</source>
					<conf-name>2020 Chinese Automation Congress (CAC)</conf-name>
					<conf-loc>Shanghai, China</conf-loc>
					<conf-date>2020</conf-date>
					<fpage>1743</fpage>
					<lpage>1747</lpage>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/CAC51589.2020.9326848">https://doi.org/10.1109/CAC51589.2020.9326848</ext-link>
				</element-citation>
			</ref>
			<ref id="B23">
				<label>[23]</label>
				<mixed-citation>[23] Y. Pang, J. Lin, T. Qin, and Z. Chen, “Image-to-Image Translation: Methods and Applications,” <italic>IEEE Trans. Multimedia</italic>, vol. 24, pp. 3859-3881, Sep. 2021. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/TMM.2021.3109419">https://doi.org/10.1109/TMM.2021.3109419</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Pang</surname>
							<given-names>Y.</given-names>
						</name>
						<name>
							<surname>Lin</surname>
							<given-names>J.</given-names>
						</name>
						<name>
							<surname>Qin</surname>
							<given-names>T.</given-names>
						</name>
						<name>
							<surname>Chen</surname>
							<given-names>Z.</given-names>
						</name>
					</person-group>
					<article-title>Image-to-Image Translation: Methods and Applications</article-title>
					<source>IEEE Trans. Multimedia</source>
					<volume>24</volume>
					<fpage>3859</fpage>
					<lpage>3881</lpage>
					<month>09</month>
					<year>2021</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/TMM.2021.3109419">https://doi.org/10.1109/TMM.2021.3109419</ext-link>
				</element-citation>
			</ref>
			<ref id="B24">
				<label>[24]</label>
				<mixed-citation>[24] M. Carmen, J. Lizandra, C. Monserrat, A. José, and H. Orallo, “Síntesis de Imágenes en Imagen Médica,” <italic>Universidad Politécnica de Valencia</italic>, 2003. <ext-link ext-link-type="uri" xlink:href="https://josephorallo.webs.upv.es/escrits/ACTA3.pdf">https://josephorallo.webs.upv.es/escrits/ACTA3.pdf</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Carmen</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>Lizandra</surname>
							<given-names>J.</given-names>
						</name>
						<name>
							<surname>Monserrat</surname>
							<given-names>C.</given-names>
						</name>
						<name>
							<surname>José</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Orallo</surname>
							<given-names>H.</given-names>
						</name>
					</person-group>
					<article-title>Síntesis de Imágenes en Imagen Médica</article-title>
					<source>Universidad Politécnica de Valencia</source>
					<year>2003</year>
					<ext-link ext-link-type="uri" xlink:href="https://josephorallo.webs.upv.es/escrits/ACTA3.pdf">https://josephorallo.webs.upv.es/escrits/ACTA3.pdf</ext-link>
				</element-citation>
			</ref>
			<ref id="B25">
				<label>[25]</label>
				<mixed-citation>[25] A. Anwar “Difference between AutoEncoder (AE) and Variational AutoEncoder (VAE),” towardsdatascience.com Accessed: Feb. 20, 2024. [Online]. Available: <ext-link ext-link-type="uri" xlink:href="https://towardsdatascience.com/difference-between-autoencoder-ae-and-variational-autoencoder-vae-ed7be1c038f2">https://towardsdatascience.com/difference-between-autoencoder-ae-and-variational-autoencoder-vae-ed7be1c038f2</ext-link>
				</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Anwar</surname>
							<given-names>A.</given-names>
						</name>
					</person-group>
					<source>Difference between AutoEncoder (AE) and Variational AutoEncoder (VAE)</source>
					<publisher-name>towardsdatascience.com</publisher-name>
					<comment>Accessed</comment>
					<day>20</day>
					<month>02</month>
					<year>2024</year>
					<comment>Online</comment>
					<comment>Available</comment>
					<ext-link ext-link-type="uri" xlink:href="https://towardsdatascience.com/difference-between-autoencoder-ae-and-variational-autoencoder-vae-ed7be1c038f2">https://towardsdatascience.com/difference-between-autoencoder-ae-and-variational-autoencoder-vae-ed7be1c038f2</ext-link>
				</element-citation>
			</ref>
			<ref id="B26">
				<label>[26]</label>
				<mixed-citation>[26] W. Weng, and X. Zhu, “INet: Convolutional Networks for Biomedical Image Segmentation,” <italic>IEEE Access</italic>, vol. 9, pp. 16591-16603, 2021. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/ACCESS.2021.3053408">https://doi.org/10.1109/ACCESS.2021.3053408</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Weng</surname>
							<given-names>W.</given-names>
						</name>
						<name>
							<surname>Zhu</surname>
							<given-names>X.</given-names>
						</name>
					</person-group>
					<article-title>INet: Convolutional Networks for Biomedical Image Segmentation</article-title>
					<source>IEEE Access</source>
					<volume>9</volume>
					<fpage>16591</fpage>
					<lpage>16603</lpage>
					<year>2021</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/ACCESS.2021.3053408">https://doi.org/10.1109/ACCESS.2021.3053408</ext-link>
				</element-citation>
			</ref>
			<ref id="B27">
				<label>[27]</label>
				<mixed-citation>[27] I. J. Goodfellow <italic>et al.</italic>, “Generative Adversarial Networks,” <italic>Advances in Neural Information Processing Systems</italic>, vol. 14, Jun. 2014. <ext-link ext-link-type="uri" xlink:href="https://doi.org/https://doi.org/10.48550/arXiv.1406.2661">https://doi.org/https://doi.org/10.48550/arXiv.1406.2661</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Goodfellow</surname>
							<given-names>I. J.</given-names>
						</name>
						<etal/>
					</person-group>
					<article-title>Generative Adversarial Networks</article-title>
					<source>Advances in Neural Information Processing Systems</source>
					<volume>14</volume>
					<month>06</month>
					<year>2014</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/https://doi.org/10.48550/arXiv.1406.2661">https://doi.org/https://doi.org/10.48550/arXiv.1406.2661</ext-link>
				</element-citation>
			</ref>
			<ref id="B28">
				<label>[28]</label>
				<mixed-citation>[28] I. C. Moreira, I. Amaral, I. Domingues, A. Cardoso, M. J. Cardoso, and J. S. Cardoso “INbreast: toward a full-field digital mammographic database,” <italic>Acad. Radiol.</italic>, vol. 19, no. 2, pp. 236-248, Feb. 2012. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1016/j.acra.2011.09.014">https://doi.org/10.1016/j.acra.2011.09.014</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Moreira</surname>
							<given-names>I. C.</given-names>
						</name>
						<name>
							<surname>Amaral</surname>
							<given-names>I.</given-names>
						</name>
						<name>
							<surname>Domingues</surname>
							<given-names>I.</given-names>
						</name>
						<name>
							<surname>Cardoso</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Cardoso</surname>
							<given-names>M. J.</given-names>
						</name>
						<name>
							<surname>Cardoso</surname>
							<given-names>J. S.</given-names>
						</name>
					</person-group>
					<article-title>INbreast: toward a full-field digital mammographic database</article-title>
					<source>Acad. Radiol.</source>
					<volume>19</volume>
					<issue>2</issue>
					<fpage>236</fpage>
					<lpage>248</lpage>
					<month>02</month>
					<year>2012</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1016/j.acra.2011.09.014">https://doi.org/10.1016/j.acra.2011.09.014</ext-link>
				</element-citation>
			</ref>
			<ref id="B29">
				<label>[29]</label>
				<mixed-citation>[29] F. Gao, T. Wu, X. Chu, H. Yoon, Y. Xu, and B. Patel, “Deep Residual Inception Encoder-Decoder Network for Medical Imaging Synthesis,” <italic>IEEE Journal of Biomedical and Health Informatics</italic>, vol. 24, no. 1, pp. 39-49, Apr. 2020. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/JBHI.2019.2912659">https://doi.org/10.1109/JBHI.2019.2912659</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Gao</surname>
							<given-names>F.</given-names>
						</name>
						<name>
							<surname>Wu</surname>
							<given-names>T.</given-names>
						</name>
						<name>
							<surname>Chu</surname>
							<given-names>X.</given-names>
						</name>
						<name>
							<surname>Yoon</surname>
							<given-names>H.</given-names>
						</name>
						<name>
							<surname>Xu</surname>
							<given-names>Y.</given-names>
						</name>
						<name>
							<surname>Patel</surname>
							<given-names>B.</given-names>
						</name>
					</person-group>
					<article-title>Deep Residual Inception Encoder-Decoder Network for Medical Imaging Synthesis</article-title>
					<source>IEEE Journal of Biomedical and Health Informatics</source>
					<volume>24</volume>
					<issue>1</issue>
					<fpage>39</fpage>
					<lpage>49</lpage>
					<month>04</month>
					<year>2020</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/JBHI.2019.2912659">https://doi.org/10.1109/JBHI.2019.2912659</ext-link>
				</element-citation>
			</ref>
			<ref id="B30">
				<label>[30]</label>
				<mixed-citation>[30] M. Mori <italic>et al.</italic>, “Feasibility of new fat suppression for breast MRI using pix2pix,” <italic>Jpn. J. Radiol.</italic>, vol. 38, no. 11, pp. 1075-1081, Nov. 2020. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/s11604-020-01012-5">https://doi.org/10.1007/s11604-020-01012-5</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Mori</surname>
							<given-names>M.</given-names>
						</name>
						<etal/>
					</person-group>
					<article-title>Feasibility of new fat suppression for breast MRI using pix2pix</article-title>
					<source>Jpn. J. Radiol.</source>
					<volume>38</volume>
					<issue>11</issue>
					<fpage>1075</fpage>
					<lpage>1081</lpage>
					<month>11</month>
					<year>2020</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/s11604-020-01012-5">https://doi.org/10.1007/s11604-020-01012-5</ext-link>
				</element-citation>
			</ref>
			<ref id="B31">
				<label>[31]</label>
				<mixed-citation>[31] P. Isola, Z. Jun-Yan, T. Zhou, and A. A. Efros, “Image-to-Image Translation with Conditional Adversarial Networks,” in <italic>2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)</italic>, Honolulu, HI, USA, 2017, pp. 5967-5976. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/CVPR.2017.632">https://doi.org/10.1109/CVPR.2017.632</ext-link>
				</mixed-citation>
				<element-citation publication-type="confproc">
					<person-group person-group-type="author">
						<name>
							<surname>Isola</surname>
							<given-names>P.</given-names>
						</name>
						<name>
							<surname>Jun-Yan</surname>
							<given-names>Z.</given-names>
						</name>
						<name>
							<surname>Zhou</surname>
							<given-names>T.</given-names>
						</name>
						<name>
							<surname>Efros</surname>
							<given-names>A. A.</given-names>
						</name>
					</person-group>
					<source>Image-to-Image Translation with Conditional Adversarial Networks</source>
					<conf-name>2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)</conf-name>
					<conf-loc>Honolulu, HI, USA</conf-loc>
					<conf-date>2017</conf-date>
					<fpage>5967</fpage>
					<lpage>5976</lpage>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/CVPR.2017.632">https://doi.org/10.1109/CVPR.2017.632</ext-link>
				</element-citation>
			</ref>
			<ref id="B32">
				<label>[32]</label>
				<mixed-citation>[32] P. Wang <italic>et al.</italic>, “Synthesizing the First Phase of Dynamic Sequences of Breast MRI for Enhanced Lesion Identification,” <italic>Front. Oncol.</italic>, vol. 11, Dec. 2021. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3389/fonc.2021.792516">https://doi.org/10.3389/fonc.2021.792516</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Wang</surname>
							<given-names>P.</given-names>
						</name>
						<etal/>
					</person-group>
					<article-title>Synthesizing the First Phase of Dynamic Sequences of Breast MRI for Enhanced Lesion Identification</article-title>
					<source>Front. Oncol.</source>
					<volume>11</volume>
					<month>12</month>
					<year>2021</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3389/fonc.2021.792516">https://doi.org/10.3389/fonc.2021.792516</ext-link>
				</element-citation>
			</ref>
			<ref id="B33">
				<label>[33]</label>
				<mixed-citation>[33] Z. Sani, R. Prasad, and E. K. M. Hashim, “Breast Cancer Detection in Mammography using Faster Region Convolutional Neural Networks and Group Convolution,” <italic>ETE J. Res.</italic>, pp. 1-17, May 2024. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1080/03772063.2024.2352643">https://doi.org/10.1080/03772063.2024.2352643</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Sani</surname>
							<given-names>Z.</given-names>
						</name>
						<name>
							<surname>Prasad</surname>
							<given-names>R.</given-names>
						</name>
						<name>
							<surname>Hashim</surname>
							<given-names>E. K. M.</given-names>
						</name>
					</person-group>
					<article-title>Breast Cancer Detection in Mammography using Faster Region Convolutional Neural Networks and Group Convolution</article-title>
					<source>ETE J. Res.</source>
					<fpage>1</fpage>
					<lpage>17</lpage>
					<month>05</month>
					<year>2024</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1080/03772063.2024.2352643">https://doi.org/10.1080/03772063.2024.2352643</ext-link>
				</element-citation>
			</ref>
			<ref id="B34">
				<label>[34]</label>
				<mixed-citation>[34] M. Fan <italic>et al.</italic>, “Generative adversarial network-based synthesis of contrast-enhanced MR images from precontrast images for predicting histological characteristics in breast cancer,” <italic>Phys. Med. Biol.</italic>, vol. 69, no. 9, p. 095002, Apr. 2024. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1088/1361-6560/ad3889">https://doi.org/10.1088/1361-6560/ad3889</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Fan</surname>
							<given-names>M.</given-names>
						</name>
						<etal/>
					</person-group>
					<article-title>Generative adversarial network-based synthesis of contrast-enhanced MR images from precontrast images for predicting histological characteristics in breast cancer</article-title>
					<source>Phys. Med. Biol.</source>
					<volume>69</volume>
					<issue>9</issue>
					<fpage>095002</fpage>
					<lpage>095002</lpage>
					<month>04</month>
					<year>2024</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1088/1361-6560/ad3889">https://doi.org/10.1088/1361-6560/ad3889</ext-link>
				</element-citation>
			</ref>
			<ref id="B35">
				<label>[35]</label>
				<mixed-citation>[35] O. Young-Tack, E. Ko, and H. Park, “TDM-Stargan: Stargan Using Time Difference Map to Generate Dynamic Contrast-Enhanced Mri from Ultrafast Dynamic Contrast-Enhanced Mri,” in <italic>2022 IEEE 19th International Symposium on Biomedical Imaging (ISBI)</italic>, Kolkata, India, 2022, pp. 1-5. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/ISBI52829.2022.9761463">https://doi.org/10.1109/ISBI52829.2022.9761463</ext-link>
				</mixed-citation>
				<element-citation publication-type="confproc">
					<person-group person-group-type="author">
						<name>
							<surname>Young-Tack</surname>
							<given-names>O.</given-names>
						</name>
						<name>
							<surname>Ko</surname>
							<given-names>E.</given-names>
						</name>
						<name>
							<surname>Park</surname>
							<given-names>H.</given-names>
						</name>
					</person-group>
					<source>TDM-Stargan: Stargan Using Time Difference Map to Generate Dynamic Contrast-Enhanced Mri from Ultrafast Dynamic Contrast-Enhanced Mri</source>
					<conf-name>2022 IEEE 19th International Symposium on Biomedical Imaging (ISBI)</conf-name>
					<conf-loc>Kolkata, India</conf-loc>
					<conf-date>2022</conf-date>
					<fpage>1</fpage>
					<lpage>5</lpage>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/ISBI52829.2022.9761463">https://doi.org/10.1109/ISBI52829.2022.9761463</ext-link>
				</element-citation>
			</ref>
			<ref id="B36">
				<label>[36]</label>
				<mixed-citation>[36] T. Fujioka <italic>et al.</italic>, “Proposal to improve the image quality of short-acquisition time-dedicated breast positron emission tomography using the Pix2pix generative adversarial network,” <italic>Diagnostics</italic>, vol. 12, no. 12, p. 3114, Dec. 2022. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3390/diagnostics12123114">https://doi.org/10.3390/diagnostics12123114</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Fujioka</surname>
							<given-names>T.</given-names>
						</name>
						<etal/>
					</person-group>
					<article-title>Proposal to improve the image quality of short-acquisition time-dedicated breast positron emission tomography using the Pix2pix generative adversarial network</article-title>
					<source>Diagnostics</source>
					<volume>12</volume>
					<issue>12</issue>
					<fpage>3114</fpage>
					<lpage>3114</lpage>
					<month>12</month>
					<year>2022</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3390/diagnostics12123114">https://doi.org/10.3390/diagnostics12123114</ext-link>
				</element-citation>
			</ref>
			<ref id="B37">
				<label>[37]</label>
				<mixed-citation>[37] G. Jiang, Y. Lu, J. Wei, and Y. Xu, “Synthesize Mammogram from Digital Breast Tomosynthesis with Gradient Guided cGANs,” <italic>Springer International Publishing</italic>, D. Shen <italic>et al.</italic>, Eds. vol. 11769, Oct. 2019. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/978-3-030-32226-7_89">https://doi.org/10.1007/978-3-030-32226-7_89</ext-link>
				</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Jiang</surname>
							<given-names>G.</given-names>
						</name>
						<name>
							<surname>Lu</surname>
							<given-names>Y.</given-names>
						</name>
						<name>
							<surname>Wei</surname>
							<given-names>J.</given-names>
						</name>
						<name>
							<surname>Xu</surname>
							<given-names>Y.</given-names>
						</name>
					</person-group>
					<source>Synthesize Mammogram from Digital Breast Tomosynthesis with Gradient Guided cGANs</source>
					<publisher-name>Springer International Publishing</publisher-name>
					<person-group person-group-type="editor">
						<name>
							<surname>Shen</surname>
							<given-names>D.</given-names>
						</name>
						<etal/>
					</person-group>
					<comment>Eds.</comment>
					<fpage>11769</fpage>
					<lpage>11769</lpage>
					<month>10</month>
					<year>2019</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/978-3-030-32226-7_89">https://doi.org/10.1007/978-3-030-32226-7_89</ext-link>
				</element-citation>
			</ref>
			<ref id="B38">
				<label>[38]</label>
				<mixed-citation>[38] B. Yu, L. Zhou, L. Wang, Y. Shi, J. Fripp, and P. Bourgeat, “Ea-GANs: Edge-Aware Generative Adversarial Networks for Cross-Modality MR Image Synthesis,” <italic>IEEE Transactions on Medical Imaging</italic>, vol. 38, no. 7, pp. 1750-1762, Jan. 2019. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/TMI.2019.2895894">https://doi.org/10.1109/TMI.2019.2895894</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Yu</surname>
							<given-names>B.</given-names>
						</name>
						<name>
							<surname>Zhou</surname>
							<given-names>L.</given-names>
						</name>
						<name>
							<surname>Wang</surname>
							<given-names>L.</given-names>
						</name>
						<name>
							<surname>Shi</surname>
							<given-names>Y.</given-names>
						</name>
						<name>
							<surname>Fripp</surname>
							<given-names>J.</given-names>
						</name>
						<name>
							<surname>Bourgeat</surname>
							<given-names>P.</given-names>
						</name>
					</person-group>
					<article-title>Ea-GANs: Edge-Aware Generative Adversarial Networks for Cross-Modality MR Image Synthesis</article-title>
					<source>IEEE Transactions on Medical Imaging</source>
					<volume>38</volume>
					<issue>7</issue>
					<fpage>1750</fpage>
					<lpage>1762</lpage>
					<month>01</month>
					<year>2019</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/TMI.2019.2895894">https://doi.org/10.1109/TMI.2019.2895894</ext-link>
				</element-citation>
			</ref>
			<ref id="B39">
				<label>[39]</label>
				<mixed-citation>[39] B. H. Menze <italic>et al</italic>., “The Multimodal Brain Tumor Image Segmentation Benchmark (BRATS),” <italic>IEEE Transactions on Medical Imaging</italic>, vol. 34, no. 10, pp. 1993-2024, Dec. 2015. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/TMI.2014.2377694">https://doi.org/10.1109/TMI.2014.2377694</ext-link>
				</mixed-citation>
				<element-citation publication-type="journal">
					<person-group person-group-type="author">
						<name>
							<surname>Menze</surname>
							<given-names>B. H.</given-names>
						</name>
						<etal/>
					</person-group>
					<article-title>The Multimodal Brain Tumor Image Segmentation Benchmark (BRATS)</article-title>
					<source>IEEE Transactions on Medical Imaging</source>
					<volume>34</volume>
					<issue>10</issue>
					<fpage>1993</fpage>
					<lpage>2024</lpage>
					<month>12</month>
					<year>2015</year>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/TMI.2014.2377694">https://doi.org/10.1109/TMI.2014.2377694</ext-link>
				</element-citation>
			</ref>
			<ref id="B40">
				<label>[40]</label>
				<mixed-citation>[40] D. Duque-Arias <italic>et al.</italic>, “On power jaccard losses for semantic segmentation,” in <italic>Proceedings of the 16th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications</italic>, Setúbal, Portugal, 2021, pp. 561-568. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5220/0010304005610568">https://doi.org/10.5220/0010304005610568</ext-link>
				</mixed-citation>
				<element-citation publication-type="confproc">
					<person-group person-group-type="author">
						<name>
							<surname>Duque-Arias</surname>
							<given-names>D.</given-names>
						</name>
						<etal/>
					</person-group>
					<source>On power jaccard losses for semantic segmentation</source>
					<conf-name>Proceedings of the 16th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications</conf-name>
					<conf-loc>Setúbal, Portugal</conf-loc>
					<conf-date>2021</conf-date>
					<fpage>561</fpage>
					<lpage>568</lpage>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5220/0010304005610568">https://doi.org/10.5220/0010304005610568</ext-link>
				</element-citation>
			</ref>
			<ref id="B41">
				<label>[41]</label>
				<mixed-citation>[41] M. Berman, A. R. Triki, and M. B. Blaschko, “The Lovasz-Softmax Loss: A Tractable Surrogate for the Optimization of the Intersection-Over-Union Measure in Neural Networks,” in <italic>2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition</italic>, Salt Lake City, UT, USA, 2018, pp. 4413-4421. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/CVPR.2018.00464">https://doi.org/10.1109/CVPR.2018.00464</ext-link>
				</mixed-citation>
				<element-citation publication-type="confproc">
					<person-group person-group-type="author">
						<name>
							<surname>Berman</surname>
							<given-names>M.</given-names>
						</name>
						<name>
							<surname>Triki</surname>
							<given-names>A. R.</given-names>
						</name>
						<name>
							<surname>Blaschko</surname>
							<given-names>M. B.</given-names>
						</name>
					</person-group>
					<source>The Lovasz-Softmax Loss: A Tractable Surrogate for the Optimization of the Intersection-Over-Union Measure in Neural Networks</source>
					<conf-name>2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition</conf-name>
					<conf-loc>Salt Lake City, UT, USA</conf-loc>
					<conf-date>2018</conf-date>
					<fpage>4413</fpage>
					<lpage>4421</lpage>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/CVPR.2018.00464">https://doi.org/10.1109/CVPR.2018.00464</ext-link>
				</element-citation>
			</ref>
			<ref id="B42">
				<label>[42]</label>
				<mixed-citation>[42] B. Xu, N. Wang, T. Chen, and M. Li, “Empirical Evaluation of Rectified Activations in Convolutional Network,” 2015, <italic>arXiv:1505.00853</italic>. <ext-link ext-link-type="uri" xlink:href="http://arxiv.org/abs/1505.00853">http://arxiv.org/abs/1505.00853</ext-link>
				</mixed-citation>
				<element-citation publication-type="book">
					<person-group person-group-type="author">
						<name>
							<surname>Xu</surname>
							<given-names>B.</given-names>
						</name>
						<name>
							<surname>Wang</surname>
							<given-names>N.</given-names>
						</name>
						<name>
							<surname>Chen</surname>
							<given-names>T.</given-names>
						</name>
						<name>
							<surname>Li</surname>
							<given-names>M.</given-names>
						</name>
					</person-group>
					<source>Empirical Evaluation of Rectified Activations in Convolutional Network</source>
					<year>2015</year>
					<publisher-name>arXiv:1505.00853</publisher-name>
					<ext-link ext-link-type="uri" xlink:href="http://arxiv.org/abs/1505.00853">http://arxiv.org/abs/1505.00853</ext-link>
				</element-citation>
			</ref>
			<ref id="B43">
				<label>[43]</label>
				<mixed-citation>[43] A. Horé, and D. Ziou, “Image Quality Metrics: PSNR vs. SSIM,” in <italic>2010 20th International Conference on Pattern Recognition</italic>, Istanbul, Turkey, 2010, pp. 2366-2369. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/ICPR.2010.57">https://doi.org/10.1109/ICPR.2010.57</ext-link>
				</mixed-citation>
				<element-citation publication-type="confproc">
					<person-group person-group-type="author">
						<name>
							<surname>Horé</surname>
							<given-names>A.</given-names>
						</name>
						<name>
							<surname>Ziou</surname>
							<given-names>D.</given-names>
						</name>
					</person-group>
					<source>Image Quality Metrics: PSNR vs. SSIM</source>
					<conf-name>2010 20th International Conference on Pattern Recognition</conf-name>
					<conf-loc>Istanbul, Turkey</conf-loc>
					<conf-date>2010</conf-date>
					<fpage>2366</fpage>
					<lpage>2369</lpage>
					<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/ICPR.2010.57">https://doi.org/10.1109/ICPR.2010.57</ext-link>
				</element-citation>
			</ref>
		</ref-list>
		<fn-group>
			<fn fn-type="other" id="fn1">
				<label>How to cite / Cómo citar </label>
				<p> S. Cañaveral, C. Mera-Banguero, and R. D. Fonnegra, “Postcontrast Medical Image Synthesis in Breast DCE-MRI Using Deep Learning,” <italic>TecnoLógicas</italic>, vol. 27, no. 60, e3052, 2024.<ext-link ext-link-type="uri" xlink:href="https://doi.org/10.22430/22565337.3052">https://doi.org/10.22430/22565337.3052</ext-link>
				</p>
			</fn>
		</fn-group>
	</back>
	<sub-article article-type="translation" id="s1" xml:lang="es">
		<front-stub>
			<article-categories>
				<subj-group subj-group-type="heading">
					<subject>Artículo de investigación</subject>
				</subj-group>
			</article-categories>
			<title-group>
				<article-title>Síntesis de imagen médica postcontraste en estudios de DCE-MRI de mama usando aprendizaje profundo</article-title>
			</title-group>
			<author-notes>
				<corresp id="c0">
					<label>*</label> saracanaveral207005@correo.itm.edu.co</corresp>
				<fn fn-type="conflict" id="fn7">
					<label>CONFLICTOS DE INTERÉS DE LOS AUTORES</label>
					<p> Los autores declaran que no existe conflicto de intereses con respecto a la publicación de este trabajo</p>
				</fn>
				<fn fn-type="equal" id="fn8">
					<label>Sara Cañaveral:</label>
					<p> Diseño y realización de los experimentos, análisis e interpretación de los datos, redacción del borrador del manuscrito y revisión final.</p>
				</fn>
				<fn fn-type="equal" id="fn9">
					<label>Rubén Fonnegra:</label>
					<p>contribuyó con el diseño de los experimentos, el análisis e interpretación de los datos, en las revisiones parciales y final del manuscrito.</p>
				</fn>
				<fn fn-type="equal" id="fn10">
					<label>Carlos Mera-Banguero:</label>
					<p> contribuyó con el diseño de los experimentos, el análisis e interpretación de los datos, en las revisiones parciales y final del manuscrito. El autor Carlos Mera-Banguero, inició su participación en este trabajo como docente del Instituto Tecnológico Metropolitano de Medellín (ITM), pero sus contribuciones a la versión final del manuscrito se realizaron estando afiliado a la Universidad de Antioquia.</p>
				</fn>
			</author-notes>
			<abstract>
				<title>Resumen</title>
				<p>El cáncer de mama es una de las principales causas de muerte en mujeres en el mundo, por lo que su detección de forma temprana se ha convertido en una prioridad para salvar vidas. Para el diagnóstico de este tipo de cáncer existen técnicas como la imagen de resonancia magnética dinámica con realce de contraste (DCE-MRI, por sus siglas en inglés), la cual usa un agente de contraste para realzar las anomalías en el tejido de la mama, lo que mejora la detección y caracterización de posibles tumores. Como limitación, los estudios de DCE-MRI suelen tener un costo alto, hay poca disponibilidad de equipos para realizarlos, y en algunos casos los medios de contraste pueden generar efectos adversos por reacciones alérgicas. Considerando lo anterior, este trabajo tuvo como objetivo el uso de modelos de aprendizaje profundo para la generación de imágenes sintéticas postcontraste en estudios de DCE-MRI. La metodología consistió en el desarrollo de una función de costo denominada pérdida en las regiones con realce de contraste que aprovecha el comportamiento de la captación del agente de contraste. Como resultado se entrenaron dos nuevas arquitecturas de aprendizaje profundo, las cuales hemos denominado G-RiedGAN y D-RiedGAN, para la generación de imágenes postcontraste en estudios de DCE-MRI, a partir de imágenes precontraste. Finalmente, se concluye que las métricas proporción máxima señal ruido, índice de similitud estructural y error absoluto medio muestran que las arquitecturas propuestas mejoran el proceso de síntesis de las imágenes postcontraste preservando mayor similitud entre las imágenes sintéticas y las imágenes reales, esto en comparación con los modelos base en el estado del arte.</p>
			</abstract>
			<kwd-group xml:lang="es">
				<title>Palabras clave:</title>
				<kwd>Cáncer de mama</kwd>
				<kwd>imagen médica</kwd>
				<kwd>resonancia magnética</kwd>
				<kwd>generación de imagen postcontraste</kwd>
				<kwd>aprendizaje profundo</kwd>
			</kwd-group>
		</front-stub>
		<body>
			<sec sec-type="intro">
				<title>1. INTRODUCCIÓN</title>
				<p>El cáncer de mama es una enfermedad crónica no transmisible y uno de los principales problemas de investigación en salud pública en el mundo debido a sus altas tazas de incidencia <sup>[</sup><xref ref-type="bibr" rid="B1"><sup>1</sup></xref><sup>].</sup> Esta enfermedad se debe a alteraciones a nivel del ADN, las cuales afectan la división y el crecimiento normal de las células del tejido. Este es uno de los cánceres que más muertes provoca en el mundo <sup>[</sup><xref ref-type="bibr" rid="B2"><sup>2</sup></xref><sup>]</sup> y es uno de los de mayor incidencia, especialmente en la población femenina. Según el observatorio global del cáncer (GLOBOCAN), en el 2022 se registraron 11.5 % de casos nuevos de cáncer de mama, respecto del total de casos de cáncer reportados en el mundo <sup>[</sup><xref ref-type="bibr" rid="B3"><sup>3</sup></xref><sup>].</sup></p>
				<p>En general, el cáncer de mama se puede clasificar en cinco tipos principales <sup>[</sup><xref ref-type="bibr" rid="B4"><sup>4</sup></xref><sup>].</sup> El primero es el carcinoma lobular in situ (CLIS), el cual es una condición benigna de la mama que se presenta en los lobulillos, pero no se disemina fuera de ellos. El segundo es el carcinoma ductal in situ (CDIS), que es un cáncer no invasivo que se manifiesta en glándulas productoras de leche o en los conductos, sin propagarse fuera de estos. El tercero es el carcinoma ductal infiltrante (CDI), que comienza en los conductos, pero luego se propaga a los tejidos circundantes de la mama. El cuarto es el carcinoma lobulillar infiltrante (CLI), que se origina en las células de los lobulillos mamarios y suele ser el más difícil de detectar porque se propaga de forma dispersa en lugar de formar un bulto definido. El quinto es el cáncer de mama inflamatorio, una forma rara y agresiva de cáncer de mama que, por lo general, no se presenta como un bulto sino como enrojecimiento, hinchazón y calor en la mama. Este último se propaga rápidamente por lo que requiere de tratamiento inmediato.</p>
				<p>El tratamiento y el pronóstico dependen del tipo y de las características específicas del cáncer de mama. No obstante, la detección temprana y el tratamiento oportuno son esenciales evitar complicaciones, mejorar el pronóstico del paciente y reducir las tasas de mortalidad <sup>[</sup><xref ref-type="bibr" rid="B5"><sup>5</sup></xref><sup>].</sup> Entre los métodos más utilizados para la detección del cáncer de mama están la mamografía y el ultrasonido de mama. La mamografía consiste en aplicar una dosis baja de rayos X con el fin de visualizar los tejidos internos de la mama, y por su bajo costo y su facilidad de aplicación es considerado como el método estándar para la detección <sup>[</sup><xref ref-type="bibr" rid="B6"><sup>6</sup></xref><sup>].</sup> Por otro lado, el ultrasonido se diferencia del primero en que utiliza ondas de sonido para visualizar el tejido de la mama <sup>[</sup><xref ref-type="bibr" rid="B7"><sup>7</sup></xref><sup>].</sup> Sin embargo, ambos métodos tienen diferentes limitaciones. La mamografía es un examen que, por su dosis de radiación, solo se recomienda en pacientes mayores de 40 años y no se puede usar en mujeres embarazadas ni en seguimiento, mientras que el ultrasonido tiene una alta dependencia de la experticia de quien realiza el examen. Una limitación común es que ambos métodos suelen fallar cuando las mamas tienen una densidad tisular alta <sup>[</sup><xref ref-type="bibr" rid="B6"><sup>6</sup></xref><sup>], [</sup><xref ref-type="bibr" rid="B8"><sup>8</sup></xref><sup>].</sup></p>
				<p>Cuando la mamografía o el ultrasonido no son concluyentes, se usan exámenes más especializados que requieren la aplicación, vía intravenosa, de un compuesto químico denominado agente de contraste <sup>[</sup><xref ref-type="bibr" rid="B9"><sup>9</sup></xref><sup>].</sup> La función del agente de contraste es aprovechar el comportamiento metabólico elevado de las células cancerígenas para resaltarlas en el tejido mamario. Tres exámenes de este tipo son la mamografía digital con realce de contraste (CEDM, por sus siglas en inglés), la imagen de resonancia magnética dinámica con realce de contraste (DCE-MRI) y la ecografía con contraste (CEUS, por sus siglas en inglés). El primero consiste en dos tomas de rayos X de la mama, una antes de aplicar el agente de contraste y con baja radiación (mamografía convencional); y otra posterior a la aplicación de agente de contraste y de alta radiación. A partir de ambas imágenes se genera una nueva imagen en postproceso denominada imagen recombinada, en la cual se resaltan las posibles regiones con absorción del agente de contraste en el tejido <sup>[</sup><xref ref-type="bibr" rid="B10"><sup>10</sup></xref><sup>].</sup> En el caso de la resonancia magnética contrastada se usan ondas magnéticas para captar la absorción del agente de contraste en el tiempo, el cual reacciona de manera acelerada en los tejidos con posibles lesiones <sup>[</sup><xref ref-type="bibr" rid="B11"><sup>11</sup></xref><sup>].</sup> El examen de DCE-MRI toma unas imágenes de ambos órganos antes de aplicar el medio de contraste y una serie de imágenes posteriores a la aplicación del contraste. Estos métodos son más sensibles a la detección debido a que proporcionan información más precisa sobre el estado de las mamas y las posibles lesiones, lo que permite la caracterización de posibles tumores. Para el caso de la CEUS, emplea un contraste intravascular que permite valorar en tiempo real la microcirculación y la perfusión vascular y tisular del tejido <sup>[12].</sup> A pesar de sus ventajas, estos exámenes están limitados por su costo, por el prolongado tiempo de adquisición y por la escasez de equipos para su realización. Adicionalmente, el agente de contraste puede provocar reacciones alérgicas o adversas en los pacientes <sup>[</sup><xref ref-type="bibr" rid="B13"><sup>13</sup></xref><sup>].</sup></p>
				<p>Entre la búsqueda de soluciones a estas limitaciones, múltiples trabajos han mostrado el potencial uso de redes neuronales de aprendizaje profundo para la generación de imágenes sintéticas que pueden replicar el efecto del agente de contraste, sin la utilización de este <sup>[</sup><xref ref-type="bibr" rid="B14"><sup>14</sup></xref><sup>]-[</sup><xref ref-type="bibr" rid="B18"><sup>18</sup></xref><sup>],</sup> a su vez que preservan la calidad visual de las imágenes.</p>
				<p>En este trabajo se propuso como contribución una función de costo denominada CeR-Loss, la cual aprovecha el comportamiento de la captación del agente de contraste para generar imágenes sintéticas postcontraste a partir de imágenes precontraste en estudios de DCE-MRI. Esta función se usa en dos nuevas arquitecturas de aprendizaje profundo, que hemos denominado G-RiedGAN y D-RiedGAN, las cuales centran su atención en las regiones de realce de contraste para mejorar el proceso de generación de las imágenes sintéticas postcontraste.</p>
			</sec>
			<sec>
				<title>2. REVISIÓN DE LITERATURA</title>
				<p>En general, el aprendizaje profundo es una rama del aprendizaje de máquinas basado en el uso de redes neuronales artificiales. Estas últimas se crean a partir de la interconexión de capas de neuronas artificiales que tienen la capacidad de auto ajustarse en función de la entrada y la cantidad de datos que procesan <sup>[</sup><xref ref-type="bibr" rid="B19"><sup>19</sup></xref><sup>].</sup> Una de las áreas de aplicación de las redes de aprendizaje profundo es la síntesis de imágenes. Esta consiste en la generación de imágenes artificiales a partir de una descripción visual o textual de su contenido. En el campo de la medicina, la síntesis de imágenes se ha utilizado para múltiples propósitos; por ejemplo, para aumentar los conjuntos de datos que entrenan modelos para ayuda al diagnóstico de enfermedades, como el cáncer <sup>[</sup><xref ref-type="bibr" rid="B20"><sup>20</sup></xref><sup>];</sup> para mejorar la resolución de las imágenes obtenidas en ciertas modalidades de imágenes <sup>[</sup><xref ref-type="bibr" rid="B21"><sup>21</sup></xref><sup>];</sup> para segmentar regiones de interés en la imagen <sup>[22];</sup> y para obtener la imagen de una modalidad de examen a partir de los datos de otra modalidad <sup>[</sup><xref ref-type="bibr" rid="B23"><sup>23</sup></xref><sup>],</sup> entre otras aplicaciones. La importancia del uso de la síntesis de imágenes en el campo médico radica en su potencial, no solo para ayudar a mejorar la precisión en el diagnóstico de ciertas enfermedades, sino también en reducir el tiempo y costo de captura en ciertas modalidades de imágenes diagnosticas, lo que puede permitir ampliar la cobertura de este tipo de exámenes médicos <sup>[</sup><xref ref-type="bibr" rid="B24"><sup>24</sup></xref><sup>].</sup></p>
				<p>Los modelos para la síntesis de imágenes se pueden agrupar, de manera general, en dos: los <italic>autoencoders</italic> y las redes generativas adversarias (GAN, por sus siglas en inglés). Los <italic>autoencoders</italic> son arquitecturas que tienen dos partes, un codificador cuyo objetivo es reducir la dimensionalidad de los datos de entrada para aprender la representación abstracta (o latente) de su distribución; y un decodificador que reconstruye la información desde el espacio latente a un espacio de mayor dimensión <sup>[</sup><xref ref-type="bibr" rid="B25"><sup>25</sup></xref><sup>].</sup> Una variación de los <italic>autoencoders</italic> es una arquitectura denominada U-Net, la cual busca subsanar el problema de pérdida de información de los <italic>autoencoders,</italic> en parte copiando, la información de las capas del codificador a las capas del decodificador lo que permite que este mejore la reconstrucción de información del espacio de mayor dimensión <sup>[</sup><xref ref-type="bibr" rid="B25"><sup>25</sup></xref><sup>], [</sup><xref ref-type="bibr" rid="B26"><sup>26</sup></xref><sup>].</sup></p>
				<p>Las arquitecturas GAN se componen de un generador y un discriminador. Por un lado, el generador es una red convolucional que intenta aprender la distribución latente de los datos reales para generar información sintética a partir de una muestra de ruido aleatorio. Por otro lado, el discriminador es una red convolucional complementaria que se comporta como un experto que diferencia entre la información real y la sintética. El entrenamiento de ambas redes se realiza de manera adversaria, así, el generador busca mejorar el proceso de generación para engañar al discriminador, mientras que este último busca mejorar su experticia para no dejarse engañar por el generador. Este aprendizaje adversario es lo que le otorga el nombre a esta arquitectura <sup>[</sup><xref ref-type="bibr" rid="B27"><sup>27</sup></xref><sup>].</sup></p>
				<p>Ambos tipos de arquitecturas generativas se han utilizado en el ámbito médico y en el contexto de ayuda al diagnóstico de cáncer de mama, los métodos de síntesis de imagen se pueden usar para generar imágenes postcontraste a partir de imágenes precontraste en estudios de DCE-MRI y CEDM. A esta aplicación se le conoce como cambio de dominio y consiste en transformar una imagen <italic>x</italic>, que es la imagen precontraste, a otra imagen similar <italic>Y</italic>, que es la imagen postcontraste <sup>[</sup><xref ref-type="bibr" rid="B21"><sup>21</sup></xref><sup>], [</sup><xref ref-type="bibr" rid="B23"><sup>23</sup></xref><sup>].</sup> Entre los trabajos de esta línea de investigación en <sup>[</sup><xref ref-type="bibr" rid="B15"><sup>15</sup></xref><sup>]</sup> describen una arquitectura generativa poco profunda, denominada SD-CNN, la cual se entrena para generar parches sintéticos de imágenes recombinadas postcontraste en estudios de CEDM a partir de parches de imágenes de mamografías digitales de campo completo. En este estudio se utilizaron dos bases de datos de imágenes independientes para extraer los parches. La primera es una base de datos pública, denominada INbreast <sup>[</sup><xref ref-type="bibr" rid="B28"><sup>28</sup></xref><sup>],</sup> de la cual usaron 89 estudios con clasificación BIRADS 1,2 (como benignos), y 5 y 6 (como malignos). La otra base de datos utilizada es privada y consiste en 49 estudios con clasificación BIRADS 4 o 5, confirmada por biopsia, de los cuales 23 son benignos y 26 malignos. Los autores indican que el uso de los parches sintéticos generados con su arquitectura mejora la precisión de un clasificador de parches de mamografía. Una de las limitaciones de esta arquitectura es que solo permite generar parches sintéticos de 3x3 píxeles a partir de parches de 15x15 píxeles, lo que restringe su uso en la síntesis de imágenes completas, además la poca profundidad de la red conlleva a que haya pocos niveles de abstracción, lo que puede reducir la capacidad para sintetizar estructuras complejas como las que definen los tejidos de la mama. </p>
				<p>Dando continuación al trabajo anterior, en <sup>[</sup><xref ref-type="bibr" rid="B29"><sup>29</sup></xref><sup>]</sup> propusieron una arquitectura tipo U-Net denominada RiedNet. Entre las modificaciones que propusieron los autores a la arquitectura U-Net de base, se introducen capas convolucionales y de convolucionales que reemplazan las capas tipo <italic>pooling</italic>, además de la agregación de un tipo de bloque llamado <italic>residual inception</italic>, el cual busca subsanar el problema del desvanecimiento del gradiente por la profundidad de la red. La arquitectura fue diseñada para la generación sintética de imágenes en el contexto médico y se evalúa, en parte en la generación de imágenes recombinadas postcontraste de estudios de CEDM a partir de imágenes de baja energía. Como limitación, la red fue entrenada para sintetizar bloques de 128x128 píxeles por lo que la síntesis de imagen completa considera el promedio de los bloques generados, lo que puede causar un efecto borroso en los tejidos reconstruidos de la mama. En este caso específico, los experimentos se realizaron sobre 139 estudios de mamografía contrastada, de los cuales 112 fueron usados para entrenar la arquitectura y 27 para prueba.</p>
				<p>En cuanto al uso de estudios de DCE-MRI para la detección de cáncer de mama, los autores en <sup>[</sup><xref ref-type="bibr" rid="B30"><sup>30</sup></xref><sup>]</sup> utilizan una arquitectura tipo GAN condicional, denominada Pix2Pix <sup>[</sup><xref ref-type="bibr" rid="B31"><sup>31</sup></xref><sup>],</sup> que tiene como objetivo generar imágenes contrastadas ponderadas en T1, con supresión de grasa, a partir de imágenes sin contraste. En general, la arquitectura Pix2Pix está compuesta por un generador tipo U-Net y un discriminador tipo PatchGAN <sup>[</sup><xref ref-type="bibr" rid="B31"><sup>31</sup></xref><sup>].</sup> Las imágenes usadas en este trabajo fueron adquiridas con una resolución de 3T, aunque fueron redimensionadas a un tamaño de 512 x 512 píxeles. En total se usaron 2630 pares de imágenes de 48 estudios de DCE-MRI. De estas, 2112 imágenes se destinaron para el entrenamiento de la arquitectura, 418 para validación y 90 para pruebas. De acuerdo con los autores, el modelo suele presentar errores cuando se usa en imágenes de mamas densas; sin embargo, resaltan el potencial de la arquitectura Pix2Pix en la generación sintética de imágenes contrastadas de DCE-MRI. Otro trabajo en esta línea es el presentado por <sup>[</sup><xref ref-type="bibr" rid="B17"><sup>17</sup></xref><sup>]</sup> en el que se propone una arquitectura tipo GAN, denominada TSGAN, la cual se compone de cuatro modelos, uno tipo U-Net y que es entrenada para generar imágenes ponderadas en T1 postcontraste, a partir de imágenes precontraste; dos discriminadores: uno global que se centra en diferenciar entre imágenes postcontraste reales y falsas, y otro local que se encarga de diferenciar entre regiones de interés reales y falsas; y finalmente, un modelo tipo U-Net que se entrena para generar máscaras de segmentación sobre las lesiones presentes en la mama.</p>
				<p>Igualmente, en <sup>[</sup><xref ref-type="bibr" rid="B32"><sup>32</sup></xref><sup>]</sup> los autores proponen una arquitectura denominada síntesis de realce de bordes (EDLS, por sus siglas en inglés) para sintetizar secuencias dinámicas a partir de imágenes T1WI en estudios de MRI. Los autores indican que la arquitectura propuesta mejora la identificación de lesiones sin el uso del agente de contraste. En <sup>[</sup><xref ref-type="bibr" rid="B33"><sup>33</sup></xref><sup>]</sup> los autores investigan el uso de arquitecturas GAN para generar imágenes de MRI de mama realistas, esto con el fin de mejorar la detección de lesiones en las mamas. Por otro lado, en <sup>[34]</sup> se propone el uso de una arquitectura CycleGAN para traducir imágenes entre diferentes dominios sin necesidad de pares de datos emparejados, mejorando la calidad de las imágenes sintetizadas.</p>
				<p>En <sup>[</sup><xref ref-type="bibr" rid="B35"><sup>35</sup></xref><sup>]</sup> propusieron una arquitectura denominada TDM-StarGAN que se emplea para generar imágenes sintéticas de las fases de estudios DCE-MRI convencionales a partir de imágenes estudios de DCE-MRI ultrarrápidos. En este trabajo los autores modificaron la arquitectura StarGAN <sup>[</sup><xref ref-type="bibr" rid="B29"><sup>29</sup></xref><sup>]</sup> para utilizarla con imágenes emparejadas, además de considerar la pérdida entre los mapas de diferencia de las imágenes generadas y la zona de captación, obtenida a partir de la diferencia entre la última imagen postcontraste y la imagen precontraste. Como conclusión, los autores indican que el modelo propuesto mejora los modelos de base usados (Pix2Pix y StarGAN) dado en que este, se enfoca en sintetizar correctamente las regiones asociadas a las lesiones.</p>
				<p>Respecto a la síntesis en otras modalidades de imagen, en <sup>[</sup><xref ref-type="bibr" rid="B36"><sup>36</sup></xref><sup>]</sup> propusieron el uso de una arquitectura Pix2Pix para mejorar la calidad de imágenes de tomografía por emisión de positrones de recuento bajo (dbPET, por sus siglas en inglés), la cual se ve afectada por la respiración de los pacientes. Los experimentos se realizaron con 49 estudios que incluyen 32 con resultados anormales y 17 con resultados normales. Cada imagen se redimensionó a 958 x 940 píxeles. De acuerdo con los autores, el uso de la arquitectura Pix2Pix puede ser usada para abordar este problema mejorando la calidad de imágenes dbPET adquiridas con tiempos cortos de adquisición. Con miras en reducir las dosis de radiación usadas en los exámenes para el diagnóstico de cáncer de mama en <sup>[</sup><xref ref-type="bibr" rid="B18"><sup>18</sup></xref><sup>], [</sup><xref ref-type="bibr" rid="B37"><sup>37</sup></xref><sup>]</sup> han desarrollado varios trabajos en los que se han entrenado diferentes modelos para generar imágenes de mamografía digital, a partir de imágenes de tomosíntesis. En sus trabajos, los autores presentaron una arquitectura denominada GGGAN que usa un generador tipo U-Net y un discriminador, que es una variante del discriminador Pix2PixHD, que en su función de pérdida usa los mapas de diferencia entre los gradientes de las imágenes generadas en ciertas capas intermedias. </p>
				<p>En un contexto diferente al diagnóstico de cáncer de mama, en <sup>[</sup><xref ref-type="bibr" rid="B38"><sup>38</sup></xref><sup>]</sup> los autores diseñaron una arquitectura basada en Pix2Pix, denominada Ea-GAN, la cual considera la inclusión de los mapas de diferencias de los bordes entre las imágenes generadas y las imágenes reales, tanto en la función de pérdida del discriminador como del generador, a fin de mejorar la síntesis de estos elementos y reducir el efecto de suavizado que suele producirse en las redes tipo U-Net <sup>[</sup><xref ref-type="bibr" rid="B14"><sup>14</sup></xref><sup>].</sup> En este trabajo los autores usaron una base de datos denominada BRATS2015 <sup>[</sup><xref ref-type="bibr" rid="B39"><sup>39</sup></xref><sup>]</sup> que contienen imágenes de MRI de 74 pacientes con resolución 240x240x155 (voxels), las imágenes fueron preproceadas y normalizadas con valores de intensidad en el rango [-1, 1].</p>
				<p>A pesar de que existen diferentes trabajos que proponen modelos generativos para la síntesis de imágenes diagnósticas para la detección del cáncer de mama, aún se evidencian algunas limitaciones. Esto se debe en cierta medida a que las imágenes de mama poseen una mayor variabilidad en densidad de tejido, lo cual implica que, al trabajar con los agentes de contraste mediante los modelos generativos, existan algunas restricciones debido a que la visualización de dicho agente de contraste disminuye en función de la intensidad de los pixeles. </p>
				<p>En la contribución de soluciones al problema de generación sintética de imágenes diagnósticas para la detección del cáncer de mama, en este trabajo se propone una arquitectura denominada D-RiedGAN que sigue el enfoque de una arquitectura Pix2Pix con bloques de incepción residual, pero que centra su atención en las regiones de realce de contraste en estudios de DCE-MRI. </p>
			</sec>
			<sec sec-type="methods">
				<title>3. METODOLOGÍA</title>
				<p>El desarrollo metodológico de este trabajo parte de la implementación de una línea base de tres modelos para sintetizar imágenes de respuesta temprana al medio de contraste, ponderadas en T1 con saturación de grasa, en estudios de DCE-MRI. A partir de la línea base se crean dos arquitecturas ensambladas y se propone dos nuevas arquitecturas, denominadas G-RiedGAN y D-RiedGAN. En general, los modelos generativos utilizados en este trabajo se entrenan para que, a partir de una imagen sin contraste <italic>x</italic>, se generen imágenes sintéticas postcontraste 𝑦̂ = 𝐺(𝑥). El objetivo es que el modelo generador 𝐺(𝑥) aprenda a generar la respuesta temprana al medio de contraste y, por tanto, hacer que las imágenes sintéticas sean similares a las imágenes reales postcontraste <italic>y</italic>.</p>
				<sec>
					<title>3.1 Optimización de regiones con realce de contraste</title>
					<p>Los modelos convencionales para la síntesis de imágenes han mostrado importantes avances en el área de procesamiento de imágenes naturales. Sin embargo, también han mostrado múltiples limitaciones, especialmente al tratarse de imágenes especializadas como las imágenes médicas. Para solventar estas limitaciones, este trabajo propone un esquema que integra una función de costo que induce la información de las regiones de realce de contraste durante el entrenamiento. El objetivo de esta función es orientar el proceso de síntesis a la correcta generación del realce de contraste en las imágenes postcontraste.</p>
					<p>En términos de intensidad de los píxeles, el realce producido por el agente de contraste se puede identificar a partir de las intensidades más altas en la imagen postcontraste. Específicamente, para detectar los píxeles con mayores niveles de intensidad en la imagen postcontraste se utiliza una estrategia de umbralización global, tal y como se muestra en (<xref ref-type="disp-formula" rid="e1">1</xref>), en donde <italic>y</italic> (<italic>i</italic>, <italic>j</italic>) es el píxel en la posición (<italic>i</italic>, <italic>j</italic>) en la imagen postcontraste y <italic>t</italic> es el valor del umbral.</p>
					<p>
						<disp-formula id="e0">
							<graphic xlink:href="2256-5337-teclo-27-60-e207-e0.png"/>
						</disp-formula>
					</p>
					<p>Por la sensibilidad del parámetro <italic>T</italic>, respecto a las variaciones de intensidades en las imágenes de diferentes estudios de DCE-MRI, este parámetro se fija para cada imagen utilizando el percentil 90 de su histograma. Es decir, se mantienen como regiones de realce de contraste el 10 % de los píxeles de la imagen con mayor intensidad. Después, se emplean las operaciones morfológicas de cierre y apertura para suavizar los contornos y eliminar pequeñas brechas entre regiones adyacentes. Ambas operaciones se aplican utilizando un elemento estructurante con forma circular de <italic>7x7</italic> píxeles. Este algoritmo se aplica tanto a la imagen sintética postcontraste, como a la imagen real postcontraste, y se les denominan máscaras de realce de contraste real (<italic>F</italic>
 <sub>
 <italic>y</italic>
</sub> ) y sintetizada (<italic>F</italic>
 <sub>
 <italic>G(x)</italic>
</sub> ).</p>
					<p>Una vez estimadas las regiones con realce de contraste, se propone una función de costo con el fin de minimizar las diferencias entre esas regiones de las imágenes reales y de las sintetizadas. Dado que las regiones de realce de contraste son de tipo binario, optimizarlas implica emplear una función de costo basada en similitud de conjuntos, como lo es el índice de Jaccard <sup>[40].</sup> Específicamente, el índice de Jaccard entre las regiones de contraste real (<italic>F</italic>
 <sub>
 <italic>y</italic>
</sub> ) y generada (<italic>F</italic>
 <sub>
 <italic>G(x)</italic>
</sub> ) se calcula usando (<xref ref-type="disp-formula" rid="e2">2</xref>).</p>
					<p>
						<disp-formula id="e01">
							<graphic xlink:href="2256-5337-teclo-27-60-e207-e01.png"/>
						</disp-formula>
					</p>
					<p>Como el índice de Jaccard no es una función convexa ni derivable, su optimización usando el algoritmo de gradiente descendente, en el contexto de las redes neuronales, puede llevar a soluciones subóptimas o incluso a errores de convergencia. De acuerdo con <sup>[</sup><xref ref-type="bibr" rid="B41"><sup>41</sup></xref><sup>],</sup> es posible aplicar una aproximación convexa con el fin de obtener una función soluble a partir de la función discreta, que a su vez es optimizable por métodos de primer orden como el gradiente descendente. Esta extensión está basada en la aproximación subrogada de Lovasz, y se estima a partir de un conjunto de predicciones erróneas 𝑚(𝑐) ∈ 𝑅<sup>𝑝</sup> para la clase 𝑐 ∈ 𝐶, en vez del vector de predicciones discretas {0, 1}<sup>𝑝</sup> . Considerando que una función ∆:{0, 1}<sup>𝑝 ↦ 𝑅𝑝</sup> es submodular (como la función 𝐽𝑐), su extensión surrogada de Lovasz está definida por (<xref ref-type="disp-formula" rid="e3">3</xref>).</p>
					<p>
						<disp-formula id="e02">
							<graphic xlink:href="2256-5337-teclo-27-60-e207-e02.png"/>
						</disp-formula>
					</p>
					<p>Donde, 𝑔<sub>𝑖</sub>(𝑚) = ∆({𝜋<sub>1</sub>. . . 𝜋<sub>𝑖</sub> }) − ∆({𝜋<sub>1</sub>. . . 𝜋<sub>𝑖−1</sub>}) siendo 𝜋 una permutación en orden de los componentes de 𝑚 en orden descendente. Naturalmente, ∆̅ es la función cerrada estricta de ∆, es linear por partes e interpola los valores de ∆ en 𝑅<sup>𝑝</sup>. Finalmente, para calcular la función surrogada de Lovasz del índice de Jaccard en (<xref ref-type="disp-formula" rid="e2">2</xref>) (∆̅ <sub>𝐽𝑐</sub>) se utiliza (<xref ref-type="disp-formula" rid="e4">4</xref>).</p>
					<p>
						<disp-formula id="e03">
							<graphic xlink:href="2256-5337-teclo-27-60-e207-e03.png"/>
						</disp-formula>
					</p>
					<p>En donde 𝑓(𝑦, 𝑦∗) corresponde a la función que permite estimar el vector de errores <italic>m</italic> a partir de las máscaras de contraste real <italic>o</italic> generada después de aplicar la función <italic>softmax</italic>. Por último, con el fin de evitar las variaciones por dependencia del tamaño del <italic>batch</italic> y el número de clases, se busca optimizar la función <italic>Lovasz</italic> a través de la combinación de esta con la entropía cruzada binaria (<italic>BCE,</italic> por sus siglas en inglés) descrita en (<xref ref-type="disp-formula" rid="e5">5</xref>), tal como lo sugieren los autores en <sup>[</sup><xref ref-type="bibr" rid="B41"><sup>41</sup></xref><sup>]</sup>.</p>
					<p>
						<disp-formula id="e04">
							<graphic xlink:href="2256-5337-teclo-27-60-e207-e04.png"/>
						</disp-formula>
					</p>
					<p>Finalmente, para optimizar los modelos propuestos se usa una función de costo que combina la BCE y la extensión subrogada de <italic>Lovasz</italic> sobre las regiones de realce de contraste, cuya tarea es optimizar la síntesis de esas regiones. Esta función se presenta en (<xref ref-type="disp-formula" rid="e6">6</xref>) y se ha denominado CeR-Loss.</p>
					<p>
						<disp-formula id="e05">
							<graphic xlink:href="2256-5337-teclo-27-60-e207-e05.png"/>
						</disp-formula>
					</p>
				</sec>
				<sec>
					<title>3.2 G-RiedGAN y D-RiedGAN</title>
					<p>Con base en los elementos antes descritos, la <xref ref-type="fig" rid="f1">Figura 1</xref>a muestra la arquitectura general del primer modelo propuesto, denominado G-RiedGAN. Esta arquitectura integra, después del generador, el filtro para la detección de las regiones de realce del contraste con el que se busca retroalimentar al generador y guiar su aprendizaje para que replique el realce de contraste. En este caso se mantiene inmutable el discriminador PatchGAN, cuya tarea es identificar si el par de imágenes precontraste y postcontraste son reales o sintetizadas. La (<xref ref-type="disp-formula" rid="e7">7</xref>) presenta la función de pérdida del generador de la G-RiedGAN. Esta función considera la pérdida general causada por la diferencia a nivel de pixeles entre la imagen real y la imagen generada y también la pérdida generada entre las regiones de realce de contraste (CeR-Loss) de esas imágenes.</p>
					<p>
						<fig id="f0">
							<label>Figura 1</label>
							<caption>
								<title>Arquitecturas G-RiedGAN y D-RiedGAN</title>
							</caption>
							<graphic xlink:href="2256-5337-teclo-27-60-e207-gf0.jpg"/>
							<attrib>Fuente: elaboración propia.</attrib>
						</fig>
					</p>
					<p>
						<disp-formula id="e06">
							<graphic xlink:href="2256-5337-teclo-27-60-e207-e06.png"/>
						</disp-formula>
					</p>
					<p>Por otra parte, denominamos D-RiedGAN a la arquitectura que incluye la diferencia entre las regiones de realce de contraste tanto en el generador como en el discriminador. Esto permite que el generador incremente su atención en esas regiones, al considerarlas en la contraparte adversaria, lo que ayuda a mejorar la calidad de las síntesis del modelo. La arquitectura D-RiedGAN se presenta en la <xref ref-type="fig" rid="f1">Figura 1</xref>b.</p>
					<p>
						<fig id="f01">
							<label>Figura 1</label>
							<caption>
								<title>Arquitecturas G-RiedGAN y D-RiedGAN</title>
							</caption>
							<graphic xlink:href="2256-5337-teclo-27-60-e207-gf01.jpg"/>
							<attrib>Fuente: elaboración propia.</attrib>
						</fig>
					</p>
					<p>Para realizar el aprendizaje adversario, el discriminador de la D-RiedGAN se modifica para recibir una tripleta de imágenes: la imagen de entrada, la imagen sintética o real y las regiones de realce de contraste de la imagen real o de la imagen sintética. Así, (<xref ref-type="disp-formula" rid="e8">8</xref>) y (<xref ref-type="disp-formula" rid="e9">9</xref>) definen las funciones de pérdida del generador y del discriminador de la D-RiedGAN, respectivamente, las cuales incluyen la pérdida de las regiones de realce de contraste (CeR-Loss).</p>
					<p>
						<disp-formula id="e07">
							<graphic xlink:href="2256-5337-teclo-27-60-e207-e07.png"/>
						</disp-formula>
					</p>
					<p>
						<disp-formula id="e08">
							<graphic xlink:href="2256-5337-teclo-27-60-e207-e08.png"/>
						</disp-formula>
					</p>
				</sec>
				<sec>
					<title>3.3 Modelos Base</title>
					<p>Como modelos de línea base para la evaluación de nuestro modelo se usaron las arquitecturas Pix2Pix <sup>[</sup><xref ref-type="bibr" rid="B31"><sup>31</sup></xref><sup>]</sup>, RiedNet <sup>[</sup><xref ref-type="bibr" rid="B29"><sup>29</sup></xref><sup>]</sup> y Ea-GAN <sup>[</sup><xref ref-type="bibr" rid="B38"><sup>38</sup></xref><sup>].</sup> La selección de estas arquitecturas obedece a los resultados que se han reportado en su uso en problemas de síntesis de imágenes médicas en distintas modalidades.</p>
					<sec>
						<title>3.3.1 Pix2Pix</title>
						<p>Pix2Pix <sup>[</sup><xref ref-type="bibr" rid="B31"><sup>31</sup></xref><sup>]</sup> es una arquitectura que utiliza información condicional para guiar el proceso de generación, lo que significa que genera una imagen de un dominio a partir de una imagen de entrada que pertenece a otro dominio. La arquitectura Pix2Pix consta de un generador tipo U-Net, un discriminador PatchGAN y una función objetivo que combina la pérdida adversaria que ayuda a que las imágenes generadas traten de ser indistinguibles de las reales, con una pérdida al nivel de los píxeles, que busca que haya una coherencia en el contenido entre la imagen generada y la imagen real. Una de las ventajas discutidas en la literatura de esta arquitectura es que preserva los detalles finos de las imágenes en el proceso de generación, lo que es crucial para la generación de imágenes postcontraste.</p>
					</sec>
					<sec>
						<title>3.3.2 RiedNet</title>
						<p>RiedNet <sup>[</sup><xref ref-type="bibr" rid="B29"><sup>29</sup></xref><sup>]</sup> es una arquitectura tipo U-Net, modificada para usar capas convolucionales y deconvolucionales. Esta arquitectura también incluye un bloque llamado residual inception que, en conjunto, buscan limitar el problema del desvanecimiento del gradiente. A diferencia de la propuesta original, en este trabajo la arquitectura RiedNet se entrenó para sintetizar imágenes completas, también se reemplazó la función de activación ReLU de las capas intermedias por la función Leaky ReLU, la cual permite que una pequeña pendiente positiva esté activa, evitando así la completa supresión de la información en esa parte de la red neuronal <sup>[</sup><xref ref-type="bibr" rid="B42"><sup>42</sup></xref><sup>].</sup> La función de activación de la capa de salida se cambió por la función tangente hiperbólica. Estos cambios se implementaron para mantener el rango de valores de las imágenes de entrada a medida que se codifica la información.</p>
					</sec>
					<sec>
						<title>3.3.3 Ea-GAN</title>
						<p>A diferencia de las dos arquitecturas anteriores, Ea-GAN <sup>[</sup><xref ref-type="bibr" rid="B38"><sup>38</sup></xref><sup>]</sup> incluye en el proceso de aprendizaje los bordes de los objetos tanto de la imagen original, como de la imagen sintetizada, calculados a partir de un filtro Sobel. De acuerdo con los autores, incluir la información de los bordes en el proceso de generación ayuda a la arquitectura a centrarse en la síntesis de las texturas y los bordes de los objetos en las imágenes. La arquitectura Ea_GAN tiene dos variaciones; la gEa-GAN, la cual introduce la diferencia entre los bordes de las imágenes sólo en la función de pérdida del generador, y la dEa-GAN la cuál además incluye la diferencia de los bordes de las imágenes en el discriminador.</p>
						<p>Considerando estas arquitecturas de base, y partiendo de la premisa que su fusión puede mejorar el proceso de síntesis, se procedió a realizar un ensamble entre ellas. El primer ensamble, al que hemos denominado RiedGAN, integra a la arquitectura RiedNet un discriminador tipo PatchGAN, esto con el fin de mejorar el proceso de síntesis utilizando un esquema de aprendizaje adversario. Sustancialmente, el cambio principal en esta red, con respecto a la Pix2Pix original, es la estructura del generador, el cual en lugar de usar un generador tipo U-Net tradicional, usa el generador tipo U-Net de la arquitectura RiedNet.</p>
						<p>Partiendo de la idea del uso de los mapas de bordes de la arquitectura Ea_GAN, también se integró el uso de los mapas de bordes a la arquitectura RiedGAN. Este ensamble generó dos modelos, el primero denominado gEa-RiedGAN, en el que se integran los mapas de bordes en el generador de la RiedGAN, y el segundo llamado dEa-RiedGAN, el cual integra la información de los mapas de bordes tanto en el generador como en el discriminador.</p>
					</sec>
				</sec>
				<sec>
					<title>3.4 Métricas de evaluación</title>
					<p>Para validar la calidad de las imágenes sintéticas generadas se utilizaron las métricas cuantitativas más comunes en la literatura: Error absoluto medio (MAE, por sus siglas en inglés), proporción máxima señal ruido (PSNR, por sus siglas en inglés) y el índice de similitud estructural (SSIM, por sus siglas en inglés). El MAE estima la diferencia píxel a píxel entre las intensidades de un par de imágenes calculando el promedio entre esas diferencias. Así, para una imagen real 𝑦𝑦, y una imagen generada 𝐺(𝑥), ambas de tamaño 𝑚𝑥𝑛 píxeles, el MAE se calcula como indica (<xref ref-type="disp-formula" rid="e10">10</xref>). En este caso, un MAE bajo indica un error menor entre la imagen sintetizada y la imagen de referencia. Valores cercanos a 0 son ideales, indicando una alta precisión. Por otro lado, un MAE alto indica un mayor error entre la imagen sintetizada y la imagen de referencia. Esto sugiere una baja precisión en la síntesis de la imagen</p>
					<p>
						<disp-formula id="e09">
							<graphic xlink:href="2256-5337-teclo-27-60-e207-e09.png"/>
						</disp-formula>
					</p>
					<p>El PSNR es una métrica empleada para definir la relación entre la máxima energía que emite una señal de cualquier tipo, y el ruido que afecta la representación de dicha señal, siendo su unidad de medida los decibeles (dB) <sup>[</sup><xref ref-type="bibr" rid="B43"><sup>43</sup></xref><sup>]</sup>. Entre mayor sea el valor del MAE, mayor es la similitud que hay entre las dos imágenes. En (<xref ref-type="disp-formula" rid="e11">11</xref>) se presenta la formulación del PSNR, en donde el término 𝑀𝐴𝑋<sub>𝑖</sub> es el valor de intensidad máximo posible para las imágenes. Un PSNR alto indica una mayor similitud entre la imagen sintetizada y la imagen de referencia, mientras valor bajo indica una mayor diferencia entre la imagen sintetizada y la imagen de referencia.</p>
					<p>
						<disp-formula id="e010">
							<graphic xlink:href="2256-5337-teclo-27-60-e207-e010.png"/>
						</disp-formula>
					</p>
					<p>El SSIM considera que los píxeles tienen fuertes interdependencias, especialmente cuando están cerca. Estas dependencias contienen información sobre luminancia, contraste y estructura de los objetos en la imagen y se pueden estimar de manera conjunta como indica (<xref ref-type="disp-formula" rid="e12">12</xref>) <sup>[</sup><xref ref-type="bibr" rid="B43"><sup>43</sup></xref><sup>]</sup>, en donde 𝜇, 𝜎 y 𝜎<sup>2</sup> son, respectivamente, las medias, desviaciones estándar y covarianzas entre las imágenes, y 𝑐<sub>1</sub> 𝑦 𝑐<sub>2</sub> son dos variables que estabilizan la división para denominadores cercanos a cero. Para este caso, un SSIM cercano a 1 indica una alta similitud estructural entre la imagen sintetizada y la imagen de referencia. Un SSIM bajo indica una menor similitud estructural. Valores por debajo de 0.4 sugieren una baja calidad en términos de estructura y textura de la imagen.</p>
					<p>
						<disp-formula id="e011">
							<graphic xlink:href="2256-5337-teclo-27-60-e207-e011.png"/>
						</disp-formula>
					</p>
					<p>Por último, los mapas de diferencia se calculan entre una imagen generada y una imagen real, donde se comparan píxeles individuales para evaluar la discrepancia entre ellos. Para calcular estos mapas, se empleó (<xref ref-type="disp-formula" rid="e13">13</xref>). Esta fórmula describe un proceso en el que se analizó cada píxel de las imágenes, y se calculó la diferencia en intensidad entre el mismo píxel en otra imagen. Cada píxel en una imagen tiene un valor que representa su intensidad, la comparación de píxeles implica restar el valor del píxel correspondiente en una imagen del valor del mismo píxel en otra imagen. El propósito de esta comparación es cuantificar y visualizar las diferencias entre las imágenes.</p>
					<p>
						<disp-formula id="e012">
							<graphic xlink:href="2256-5337-teclo-27-60-e207-e012.png"/>
						</disp-formula>
					</p>
				</sec>
			</sec>
			<sec sec-type="results|discussion">
				<title>4. RESULTADOS Y DISCUSIÓN</title>
				<sec>
					<title>4.1 Configuración experimental</title>
					<p>Los resultados reportados en este trabajo fueron obtenidos bajo la configuración experimental descrita en la <xref ref-type="table" rid="t1">Tabla 1</xref>. Esta tabla muestra los valores de los hiperparámetros usados en los diferentes modelos y ajustados según las capacidades de cómputo disponibles. Los experimentos se ejecutaron en una estación de trabajo con una CPU Intel Xeon Silver 4108 y una GPU NVIDIA Quadro P2000, con memoria 4GB. Se emplea lenguaje de programación Python versión 3.8 con una versión Pytorch 2.0.</p>
					<p>
						<table-wrap id="t01">
							<label>Tabla 1</label>
							<caption>
								<title>Hiperparámetros fijados en los experimentos</title>
							</caption>
							<graphic xlink:href="2256-5337-teclo-27-60-e207-gt01.png"/>
							<table-wrap-foot>
								<fn id="TFN01">
									<p>Fuente: elaboración propia.</p>
								</fn>
							</table-wrap-foot>
						</table-wrap>
					</p>
				</sec>
				<sec>
					<title>4.2 Base de datos</title>
					<p>Para el entrenamiento de los modelos se utilizó una base de datos privada, retrospectiva, y anonimizada de estudios de DCE-MRI de 197 pacientes. Cada estudio contiene imágenes estructurales potenciadas en T1 y T2, imágenes de difusión (DWI), y de DCE (6 dinámicos). Para este trabajo se tomó la respuesta en la secuencia T1 con saturación de grasa antes de la aplicación de medio de contraste (𝑥) y esta misma imagen con la aplicación posterior del medio de contraste en etapa temprana (𝑦). Debido a la naturaleza retrospectiva de la base de datos, se seleccionaron estudios con distintos tipos de resonadores de 1.5T, con compuestos basados en gadolinio, y con dosis entre 0.014 y 0.016 ml/mol. Estos estudios también cuentan con al menos una anomalía (benigna o maligna) anotada por expertos radiólogos usando el sistema BIRADS. La selección de los estudios se hizo manteniendo un número balanceado entre los estudios benignos y malignos.</p>
					<p>Dado que este trabajo se centra en la síntesis de las regiones de contraste, se seleccionaron aquellas imágenes en las cuales se anotan las regiones con el fin de asegurar el comportamiento de la captación. Como resultado, se obtienen 937 imágenes normalizadas en el rango [-1, 1], de las cuales 718 se usaron para el entrenamiento y 219 para la validación. Las imágenes, que originalmente tenían resoluciones desde 480x480 píxeles hasta 512x512 píxeles fueron todas redimensionadas a un tamaño de 240x240 píxeles.</p>
				</sec>
				<sec>
					<title>4.3 Evaluación comparativa</title>
					<p>La <xref ref-type="fig" rid="f2">Figura 2</xref> presenta una comparación gráfica del PSNR, SSIM y MAE obtenidos por los modelos sobre el conjunto de imágenes de validación. El gráfico muestra que los modelos G-RiedGAN y D-RiedGAN, propuestos en este trabajo, son los que obtienen el mejor desempeño. Esto indica que la estrategia de considerar las regiones de realce de contraste en el proceso de síntesis de las imágenes, a través de la función CeR-Loss, mejora la calidad de las imágenes sintéticas en función de las métricas cuantitativas.</p>
					<p>
						<fig id="f02">
							<label>Figura 2</label>
							<caption>
								<title>Gráfico de dispersión para el PSNR, SSIM y MAE en los modelos base, ensamblados y propuestos</title>
							</caption>
							<graphic xlink:href="2256-5337-teclo-27-60-e207-gf02.png"/>
							<attrib>Fuente: elaboración propia.</attrib>
						</fig>
					</p>
					<p>Aunque G-RiedGAN y D-RiedGAN presentan un desempeño ligeramente inferior en MAE comparado con RiedGAN, la reducción en el MAE para D-RiedGAN es marginal y se ve compensada por mejoras significativas en PSNR y SSIM. Esto sugiere que, aunque RiedGAN tiene una precisión ligeramente mayor en el promedio de los errores de píxeles individuales, genera imágenes más borrosas en las estructuras internas, lo cual es menos adecuado para la síntesis de imágenes médicas.</p>
					<p>En comparación con Pix2Pix <sup>[</sup><xref ref-type="bibr" rid="B28"><sup>28</sup></xref><sup>],</sup> un modelo ampliamente utilizado en estudios similares, los modelos G-RiedGAN y D-RiedGAN demuestran un mejor desempeño en PSNR y SSIM, especialmente en la síntesis de regiones de realce de contraste y en la reducción del ruido, superando así las limitaciones de Pix2Pix en mamas densas.</p>
					<p>Por otro lado, la <xref ref-type="fig" rid="f3">Figura 3</xref> muestra algunas imágenes postcontraste reales y generadas a partir de su contraparte sin contraste. En general, es posible evidenciar que los modelos logran generar de manera eficiente las estructuras anatómicas de mayor tamaño, salvo algunas diferencias notorias entre las intensidades de las estructuras de la caja torácica. A pesar de esto, es notable que los modelos G-RiedGAN y D-RiedGAN sintetizan las regiones de realce de contraste de manera superior en comparación con modelos de referencia como RiedNet <sup>[</sup><xref ref-type="bibr" rid="B12"><sup>12</sup></xref><sup>],</sup> Pix2Pix <sup>[</sup><xref ref-type="bibr" rid="B28"><sup>28</sup></xref><sup>]</sup> y EaGAN <sup>[</sup><xref ref-type="bibr" rid="B32"><sup>32</sup></xref><sup>].</sup> Estos modelos sirvieron como base para el desarrollo de G-RiedGAN y D-RiedGAN y fueron empleados para realizar comparaciones siguiendo la misma metodología. Si bien las redes mencionadas son efectivas en la generación de imágenes en sus respectivas investigaciones, uno de los propósitos de este estudio era evaluar su desempeño específico con este tipo de imágenes médicas. A partir de los resultados obtenidos, se propusieron las redes G-RiedGAN y D-RiedGAN, las cuales integran las mejores características de los modelos preexistentes, logrando una síntesis de imágenes con mayor precisión y calidad en las regiones de realce de contraste. Además, evidencian un buen desempeño en comparación con los modelos del estado del arte, especialmente en términos del ruido y las borrosidades generadas. Esto puede apreciarse de mejor manera en la <xref ref-type="fig" rid="f4">Figura 4</xref>, la cual muestra los mapas de diferencias entre las imágenes sintéticas y las imágenes reales. Como se puede observar, los mapas de diferencia asociados a los modelos propuestos (G-RiedGAN y D-RiedGAN) son los que tienen la menor diferencia entre las imágenes sintéticas y las imágenes reales.</p>
					<p>
						<fig id="f03">
							<label>Figura 3</label>
							<caption>
								<title>Resultados comparativos entre los modelos evaluados. Las regiones aumentadas corresponden con proyecciones en donde se presenta captación del agente de contraste</title>
							</caption>
							<graphic xlink:href="2256-5337-teclo-27-60-e207-gf03.png"/>
							<attrib>Fuente: elaboración propia.</attrib>
						</fig>
					</p>
					<p>
						<fig id="f04">
							<label>Figura 4</label>
							<caption>
								<title>Mapas de diferencia entre las imágenes reales y generadas por los modelos evaluados.</title>
							</caption>
							<graphic xlink:href="2256-5337-teclo-27-60-e207-gf04.png"/>
							<attrib>Fuente: elaboración propia.</attrib>
						</fig>
					</p>
				</sec>
				<sec>
					<title>4.4 Impacto de la función de costos de las regiones con realce de contraste (CeR-Loss)</title>
					<p>Debido a que la función de costo propuesta en este trabajo, denominada CeR-Loss, es el componente más importante de la arquitectura D-RiedGAN, la cual además es la que permite que el modelo obtenga los mejores resultados en comparación con los demás modelos, se realiza una prueba experimental con el fin de determinar el impacto de esta función en el entrenamiento del modelo. En este sentido, se adopta la misma configuración de la arquitectura D-RiedGAN presentada en la sección anterior, pero se varían los parámetros 𝜆<sub>𝑙1</sub> y 𝜆<sub>
 <italic>𝐿𝑜𝑣𝑎𝑠𝑧</italic>
</sub> de manera en que se mantiene por encima el 𝜆<sub>
 <italic>𝐿𝑜𝑣𝑎𝑠𝑧</italic>
</sub> en todos los casos. La <xref ref-type="fig" rid="f5">Figura 5</xref> muestra tres experimentos, para 𝜆<sub>𝑙1</sub> = 20 y 𝜆<sub>
 <italic>𝐿𝑜𝑣𝑎𝑠𝑧</italic>
</sub> = 30; 𝜆<sub>𝑙1</sub> = 40 y 𝜆<sub>
 <italic>𝐿𝑜𝑣𝑎𝑠𝑧</italic>
</sub> = 60; y 𝜆<sub>𝑙1</sub> = 100 y 𝜆<sub>
 <italic>𝐿𝑜𝑣𝑎𝑠𝑧</italic>
</sub> = 150.</p>
					<p>
						<fig id="f05">
							<label>Figura 5</label>
							<caption>
								<title>Evaluación de impacto de la función CeR-Loss en el desempeño de la arquitectura D-RiedGAN</title>
							</caption>
							<graphic xlink:href="2256-5337-teclo-27-60-e207-gf05.png"/>
							<attrib>Fuente: elaboración propia.</attrib>
						</fig>
					</p>
					<p>La <xref ref-type="fig" rid="f5">Figura 5</xref> muestra que para las métricas MAE y PSNR existe una tendencia positiva que mejora los resultados de esas métricas a medida que los valores de 𝜆<sub>𝑙1</sub> y 𝜆<sub>
 <italic>𝐿𝑜𝑣𝑎𝑠𝑧</italic>
</sub> incrementan, obteniendo su mejor desempeño cuando 𝜆<sub>𝑙1</sub> = 100 y 𝜆<sub>
 <italic>𝐿𝑜𝑣𝑎𝑠𝑧</italic>
</sub> = 150. Esto confirma el aporte positivo en los resultados por parte de la función de costo CeR-Loss.</p>
				</sec>
			</sec>
			<sec sec-type="conclusions">
				<title>5. CONCLUSIONES</title>
				<p>En este trabajo se propuso una función de costo denominada CeR-Loss, la cual aprovecha el comportamiento de la captación del agente de contraste para generar imágenes sintéticas postcontraste a partir de imágenes precontraste en estudios de DCE-MRI. Esta función se usa en dos nuevas arquitecturas de aprendizaje profundo, que hemos denominado G-RiedGAN y D-RiedGAN, las cuales centran su atención en las regiones de realce de contraste para mejorar el proceso de generación de las imágenes sintéticas postcontraste. Estas arquitecturas establecen un aporte hacia la eliminación del uso de agentes de contraste y a la reducción del costo de los estudios de DCE-MRI usados como ayuda para la detección del cáncer de mama.</p>
				<p>Las arquitecturas G-RiedGAN y D-RiedGAN que se proponen este trabajo integran elementos de las arquitecturas RIED-Net y Pix2Pix bajo la estructura de la arquitectura EaGAN. A diferencia de esta última, la D-RiedGAN integra un filtro para la detección de las regiones de realce de contraste que son las zonas clave de la síntesis en el problema de análisis de imágenes de DCE-MRI para la detección y diagnóstico del cáncer de mama. Las regiones de contraste detectadas en la imagen sintética se usan para guiar el aprendizaje de la red a partir de la función de pérdida Lovász y BCE integradas a la función de pérdida del generador y del discriminador (CeR-Loss).</p>
				<p>La evaluación comparativa se realizó teniendo en cuenta dos enfoques. El primero comparó los modelos propuestos con la función CeR-Loss, contra los modelos base del estado del arte y un grupo de modelos ensamblados. Los resultados, considerando las métricas MAE, PSNR y SSIM, muestran que los modelos propuestos obtienen un mejor desempeño en la síntesis de las regiones de realce de contraste en términos del ruido y borrosidades. El segundo enfoque evaluó el impacto de la función de pérdida CeR-Loss en el proceso de aprendizaje. Los resultados, en términos de las mismas métricas, muestran un impacto positivo en la síntesis de las regiones de contraste a medida que se pondera con un valor mayor la función CeR-Loss.</p>
				<p>Si bien la validación se realizó utilizando solo métricas cuantitativas basadas en las intensidades de los píxeles de las imágenes sintéticas, se reconoce la necesidad de a futuro hacer una validación cualitativa con radiólogos expertos para determinar la validez diagnóstica de estas imágenes. Como trabajo futuro, se sugiere realizar un análisis sobre cómo los modelos de línea base y los modelos propuestos se comportan al entrenarse con bases de datos de imágenes heterogéneas en términos de la calidad de los estudios (0.5T, 1.5T, 3T y 7T), dosis y medios de contraste diferentes. Igualmente, consideramos que las imágenes sintéticas postcontraste generadas podrían tener un impacto positivo en el entrenamiento de modelos de detección y clasificación de cáncer de mama utilizando imágenes de estudios de MRI convencionales, puesto que estas imágenes pueden brindan información adicional para entrenar esos modelos de clasificación.</p>
			</sec>
		</body>
		<back>
			<ack>
				<title>6. AGRADECIMIENTO Y FINANCIACIÓN</title>
				<p>Este trabajo ha sido financiado parcialmente por el Instituto Tecnológico Metropolitano de Medellín (ITM) a través del proyecto de investigación P20213, la Institución Universitaria Pascual Bravo y Ayudas Diagnósticas SURA S.A.S. a través del convenio específico CE-007-2020. También por la agencia de educación SAPIENCIA de Medellín.</p>
			</ack>
			<fn-group>
				<fn fn-type="other" id="fn6">
					<label>Cómo citar / How to cite</label>
					<p> S. Cañaveral, C. Mera-Banguero, and R. D. Fonnegra, “Síntesis de imagen médica postcontraste en estudios de dce-mri de mama usando aprendizaje profundo,” <italic>TecnoLógicas</italic>, vol. 27, no. 60, e3052, jul. 2024. <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.22430/22565337.3052">https://doi.org/10.22430/22565337.3052</ext-link>
					</p>
				</fn>
			</fn-group>
		</back>
	</sub-article>
</article>