<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" version="2.0">
  <channel>
    <title>question Creating Lineage with Apache Atlas and multiple Processes in Support Questions</title>
    <link>https://community.cloudera.com/t5/Support-Questions/Creating-Lineage-with-Apache-Atlas-and-multiple-Processes/m-p/365336#M239322</link>
    <description>&lt;P&gt;Hello.&amp;nbsp; I would like to get more information about how to create Lineage in Apache Atlas.&amp;nbsp; Specifically, what is the right way to create lineage that includes multiple Processes and Data Sets.&amp;nbsp; Should I just be creating multiple Entities for the Process (using entity/bulk api endpoint)?&amp;nbsp; This seems to work, but it does create multiple Entities instead of just one complex entity:&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;DIV&gt;&lt;DIV&gt;&lt;P&gt;&lt;STRONG&gt;&lt;EM&gt;{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"entities": [{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"typeName": "mysystem_dataMovement",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"attributes": {&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"id": "1305f6c4-f0da-4929-be21-dd0798dc2086",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"qualifiedName": "1305f6c4-f0da-4929-be21-dd0798dc2086@mysystem_dataegress",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"displayName": "Data&amp;nbsp;Egress&amp;nbsp;Use&amp;nbsp;Case 1",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"inputs": [{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"uniqueAttributes": {&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"qualifiedName": "c72375fb-34a5-4a22-895c-0d55435fdf26@mysystem_datasource"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;},&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"typeName": "mysystem_datasource"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}],&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"outputs": [{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"uniqueAttributes": {&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"qualifiedName": "b8e4ced9-f3f4-451a-8b24-3fa4d7970824@mysystem_computer"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;},&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"typeName": "mysystem_computer"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}],&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"description": "Data&amp;nbsp;Egress&amp;nbsp;from&amp;nbsp;Data&amp;nbsp;Source&amp;nbsp;to Computer",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"name": "dataEgressUseCase2"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;},&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"typeName": "mysystem_dataMovement",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"attributes": {&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"id": "307e6f84-41af-482e-8641-39fa258e709d",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"qualifiedName": "307e6f84-41af-482e-8641-39fa258e709d@mysystem_dataMovement",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"displayName": "Data&amp;nbsp;Egress&amp;nbsp;Use&amp;nbsp;Case&amp;nbsp;2.5",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"inputs": [{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"uniqueAttributes": {&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"qualifiedName": "b8e4ced9-f3f4-451a-8b24-3fa4d7970824@dbmesh_meshnode"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;},&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"typeName": "mysystem_computer"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}],&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"outputs": [{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"uniqueAttributes": {&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"qualifiedName": "5acddaca-6eb8-48f9-be75-fc757e442985@dbmesh_datasource"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;},&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"typeName": "mysystem_datasource"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}],&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"name": "dataEgressUseCase2.5"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}&lt;/EM&gt;&lt;/STRONG&gt;&lt;/P&gt;&lt;P&gt;&lt;STRONG&gt;&lt;EM&gt;]&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}&lt;/EM&gt;&lt;/STRONG&gt;&lt;/P&gt;&lt;/DIV&gt;&lt;/DIV&gt;</description>
    <pubDate>Sat, 04 Mar 2023 19:12:29 GMT</pubDate>
    <dc:creator>DreamDelerium</dc:creator>
    <dc:date>2023-03-04T19:12:29Z</dc:date>
    <item>
      <title>Creating Lineage with Apache Atlas and multiple Processes</title>
      <link>https://community.cloudera.com/t5/Support-Questions/Creating-Lineage-with-Apache-Atlas-and-multiple-Processes/m-p/365336#M239322</link>
      <description>&lt;P&gt;Hello.&amp;nbsp; I would like to get more information about how to create Lineage in Apache Atlas.&amp;nbsp; Specifically, what is the right way to create lineage that includes multiple Processes and Data Sets.&amp;nbsp; Should I just be creating multiple Entities for the Process (using entity/bulk api endpoint)?&amp;nbsp; This seems to work, but it does create multiple Entities instead of just one complex entity:&lt;/P&gt;&lt;P&gt;&amp;nbsp;&lt;/P&gt;&lt;DIV&gt;&lt;DIV&gt;&lt;P&gt;&lt;STRONG&gt;&lt;EM&gt;{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"entities": [{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"typeName": "mysystem_dataMovement",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"attributes": {&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"id": "1305f6c4-f0da-4929-be21-dd0798dc2086",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"qualifiedName": "1305f6c4-f0da-4929-be21-dd0798dc2086@mysystem_dataegress",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"displayName": "Data&amp;nbsp;Egress&amp;nbsp;Use&amp;nbsp;Case 1",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"inputs": [{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"uniqueAttributes": {&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"qualifiedName": "c72375fb-34a5-4a22-895c-0d55435fdf26@mysystem_datasource"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;},&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"typeName": "mysystem_datasource"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}],&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"outputs": [{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"uniqueAttributes": {&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"qualifiedName": "b8e4ced9-f3f4-451a-8b24-3fa4d7970824@mysystem_computer"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;},&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"typeName": "mysystem_computer"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}],&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"description": "Data&amp;nbsp;Egress&amp;nbsp;from&amp;nbsp;Data&amp;nbsp;Source&amp;nbsp;to Computer",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"name": "dataEgressUseCase2"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;},&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"typeName": "mysystem_dataMovement",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"attributes": {&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"id": "307e6f84-41af-482e-8641-39fa258e709d",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"qualifiedName": "307e6f84-41af-482e-8641-39fa258e709d@mysystem_dataMovement",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"displayName": "Data&amp;nbsp;Egress&amp;nbsp;Use&amp;nbsp;Case&amp;nbsp;2.5",&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"inputs": [{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"uniqueAttributes": {&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"qualifiedName": "b8e4ced9-f3f4-451a-8b24-3fa4d7970824@dbmesh_meshnode"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;},&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"typeName": "mysystem_computer"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}],&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"outputs": [{&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"uniqueAttributes": {&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"qualifiedName": "5acddaca-6eb8-48f9-be75-fc757e442985@dbmesh_datasource"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;},&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"typeName": "mysystem_datasource"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}],&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;"name": "dataEgressUseCase2.5"&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}&lt;/EM&gt;&lt;/STRONG&gt;&lt;/P&gt;&lt;P&gt;&lt;STRONG&gt;&lt;EM&gt;]&lt;/EM&gt;&lt;/STRONG&gt;&lt;BR /&gt;&lt;STRONG&gt;&lt;EM&gt;}&lt;/EM&gt;&lt;/STRONG&gt;&lt;/P&gt;&lt;/DIV&gt;&lt;/DIV&gt;</description>
      <pubDate>Sat, 04 Mar 2023 19:12:29 GMT</pubDate>
      <guid>https://community.cloudera.com/t5/Support-Questions/Creating-Lineage-with-Apache-Atlas-and-multiple-Processes/m-p/365336#M239322</guid>
      <dc:creator>DreamDelerium</dc:creator>
      <dc:date>2023-03-04T19:12:29Z</dc:date>
    </item>
    <item>
      <title>Re: Creating Lineage with Apache Atlas and multiple Processes</title>
      <link>https://community.cloudera.com/t5/Support-Questions/Creating-Lineage-with-Apache-Atlas-and-multiple-Processes/m-p/412038#M253210</link>
      <description>&lt;P&gt;Hello&amp;nbsp;&lt;a href="https://community.cloudera.com/t5/user/viewprofilepage/user-id/103044"&gt;@DreamDelerium&lt;/a&gt;&amp;nbsp;&lt;BR /&gt;&lt;BR /&gt;&lt;/P&gt;&lt;P&gt;Lineage in Apache Atlas is typically built using Process entities that link Input and Output DataSet entities. When you're dealing with multiple processes and datasets, the correct way is to model each logical step as a separate Process entity, with the associated datasets connected as inputs and outputs.&lt;/P&gt;&lt;P&gt;So yes — creating multiple Process entities is the right approach for modeling complex lineage.&lt;/P&gt;</description>
      <pubDate>Tue, 05 Aug 2025 20:36:33 GMT</pubDate>
      <guid>https://community.cloudera.com/t5/Support-Questions/Creating-Lineage-with-Apache-Atlas-and-multiple-Processes/m-p/412038#M253210</guid>
      <dc:creator>vats</dc:creator>
      <dc:date>2025-08-05T20:36:33Z</dc:date>
    </item>
  </channel>
</rss>

